打字猴:1.702649721e+09
1702649721 这里,W是以受访者年龄为条件的初婚概率,Ai是历险年龄的虚拟变量,15岁为省略类别。此回归得到的期望概率见Stata日志文件(由公式13.17估计的logit转换而来)和图13-1。审视此图,我们看到右边尾部不是很合理。
1702649722
1702649723
1702649724
1702649725
1702649726 图13-1 1994年美国成年人按历险年龄分的初婚期望概率(N=1556)
1702649727
1702649728 图的右边尾部显示,对于那些40多岁和50多岁的人,初婚概率呈上升趋势。查看下载的Stata-log-文件可以清楚地明白其原因:30多岁以后几乎人人都已结婚,因此一两个结婚案例就占了处于风险集中所有案例的不容忽视的比例。该图还在另外一种方式上产生一定的误导,因为在某些年龄(37岁、42岁、44~48岁,以及50~55岁)没有人结婚,导致(不结婚的结果)被完美预测,因此这些年龄被从方程和图中删除。这里的教训是,样本量太小可能导致误导性的结果。在继续分析之前,我删除了所有大于36岁的记录。
1702649729
1702649730 接着我再次估计模型,预测每个年龄的结婚概率(用类似于13.17的方程),然后用一个4阶多项式将历险年龄的离散年份拟合成一条平滑曲线。通过逐步增加历险年龄的乘幂并检验显著性,我发现有必要使用下面的4阶多项式来估计:
1702649731
1702649732
1702649733
1702649734
1702649735 两条曲线见图13-2和13-3。从视觉上看它们很相似,尽管正式的显著性检验表明在某些年龄点上二者之间存在显著不同。当我决定这样做的时候,我得考虑是继续用历险年龄的离散形式还是平滑形式。我倾向于用离散形式,因为它更能如实地反映数据,尽管更加简约的平滑形式也是合理的。
1702649736
1702649737
1702649738
1702649739
1702649740 图13-2 1994年美国成年人按历险年龄(15~36岁)分的初婚期望概率(离散时间模型)
1702649741
1702649742
1702649743
1702649744
1702649745 图13-3 1994年美国成年人按历险年龄(15~36岁)分的初婚期望概率(多项式模型)
1702649746
1702649747 然后,我估计另外两个模型:先纳入我认为会影响结婚年龄的其他三个变量(性别、种族和母亲的受教育程度);再纳入这三个变量与历险年龄的交互项。对所有交互项以及每个包含主效应的交互项的Wald检验清晰地表明,包括交互项的模型是首选模型,所有的检验都在0.000水平上显著。因此,在每个年龄点结婚的可能性随性别、种族和母亲的受教育程度而变化。表13-6报告了(各变量)对比率比的影响,它们是从下式估计出的系数的反对数:
1702649748
1702649749
1702649750
1702649751
1702649752 这里,W是处于风险状态的某人的结婚概率;E是受访者母亲完成的受教育年限,用与样本均值的偏差来表示;M赋值为1表示男性,为0表示女性;B赋值为1表示黑人,为0表示非黑人;Ai是历险年龄的虚拟变量,25岁为参照类别。
1702649753
1702649754 在表13-6的第一列,标示为“主效应”,表示母亲的受教育年限为样本均值的非黑人女性的结婚期望比率,用与25岁时的效应之比来表示。其余三列表示历险年龄与母亲的受教育程度、性别和种族的交互项,但这些变量在非黑人女性25岁时的系数是主效应。这些比率比可以用来做任何想做的比较。例如,在21岁前尚未结婚的女性中,黑人在此年龄段结婚的比率是非黑人的五分之三(确切地说是0.591=0.190×3.108)。在30岁尚未结婚的人群中,那些母亲是大学毕业的人在此年龄结婚的比率与同样种族、同样性别但母亲只是高中毕业的人相比高出10%〔确切地说是1.094=(0.918×1.114)4〕。
1702649755
1702649756 表13-6 用历险年龄、性别、种族和母亲的受教育程度,以及历险年龄与其他变量的交互项模型预测结婚可能性的比率比
1702649757
1702649758
1702649759
1702649760
1702649761 续表
1702649762
1702649763
1702649764
1702649765
1702649766 对分布进行平滑处理(smoothing distributions) 平滑是指通过排除“噪音”——由抽样误差或个性因素引起的与潜在趋势的偏差——而使某一分布的整体形态清晰的一种技术。最简单的平滑方法或许是移动平均法(moving average)。移动平均法是取几个连续数据点的平均值。就本节的例子而言,在每个年龄点的期望结婚概率的三年移动平均值可以这样求得:先对15、16和17岁的期望概率求平均值;再对16、17和18岁的期望概率求平均值;依此类推。一旦建立了初婚年龄的所有数据点,就可以在Stata的-egen-命令中使用子命令-ma-(“移动平均”)。但是,这个子命令在Stata 10的使用手册中不再存在(虽然它仍然可用),已经被-smooth-取代,它产生的是给定数据点的中位值而不是平均值。Stata中的另一种平滑方法是-lowess-。
1702649767
1702649768 尽管表13-6在做特定的比较时很有用,但却很难看出系数所暗示的总体模式。再次提醒一下,此时作图助于理解。图13-4和13-5是黑人和非黑人按历险年龄分的初婚期望概率的三年移动平均值。在每张图中,曲线分别表示母亲受12年和16年教育的男性和女性(这样可以在视觉上方便地表示母亲受教育程度的影响)。对移动平均值作图是因为在每个年龄点上存在大量的“上下浮动”,这可以通过查看表13-6中的系数得知(关于如何计算移动平均值的详细内容见可下载的文件“ch13_2.do”)。
1702649769
1702649770
[ 上一页 ]  [ :1.702649721e+09 ]  [ 下一页 ]