打字猴:1.702649653e+09
1702649653
1702649654
1702649655 还有一个系数有时也有帮助,那就是比率的百分比变化,即100(eb-1)。例如,我们从表13-3中的模型2可以得出结论,在所有其他因素都相同的情况下,黑人曾经受到枪械威胁或枪击的比率比非黑人高56%,因为100(1.56-1)=56。
1702649656
1702649657 然而,虽然比率比解释起来很容易,但是期望比率仍然不是很直观。因此,将期望比率转换成百分比是很有帮助的。例如,在当前的例子中,在控制了受教育程度和调查年份之后,计算每一个种族—性别组中曾经受到枪械威胁的人的期望百分比是很有用的。也就是说,我们希望由模型得到调整后的百分比,以便我们在控制了受教育程度和调查年份之后评估种族和性别组在百分比上的差异。我们可以用下面的关系式来实现我们的想法:
1702649658
1702649659
1702649660
1702649661
1702649662 这里,x是自变量取特定值之后Y的比率。注意,由于比率和百分比之间的关系是非线性的,我们需要针对要做变换的自变量选择特定的值。我在这里用与模型4同样的值,即我对1994年受过20年教育的人按种族和性别来计算期望百分比。例如,对于非黑人女性,我们有Pct(Y)=100×[0.0967/(0.0967+1)]=8.8%。对于黑人女性、非黑人男性和黑人男性,相应的期望百分比分别为14.6%、29.3%和37.2%。当然,如果我们愿意,也可以按照受教育程度和调查年份的不同取值构建一张完整的期望百分数表。这样做需要大量的手工计算。然而,结合Stata处理有限取值的因变量的有关程序,Long和Freese(2006)发展出了一套Stata-ado-文件来自动完成这些计算,并且可以生成其他用来解释逻辑斯蒂回归系数的统计量。(那些希望研究这些文件的读者可以登录Long的网页:http://www.indiana.edu/~jslsoc,点击Long和Freese著作的那个链接。)
1702649663
1702649664
1702649665
1702649666
1702649667 量化数据分析:通过社会研究检验想法 [:1702644817]
1702649668 量化数据分析:通过社会研究检验想法 第二个具体例子:日本的教育递进率
1702649669
1702649670 在教育分层文献中,一个重要假设是个体的教育获得对其父母社会地位的依赖程度随受教育水平的提高而下降。这一假设已经被具体地操作化为这样一个术语,即受教育水平从某一级到下一级的“递进率”(progression ratios)(Mare,1980;1981)。也就是说,我们会问是什么影响了人们从某一受教育水平继续升到高一水平的比率,例如,小学毕业后进入中学,进入中学后毕业,中学毕业后进入大专或大学,等等。一旦我们用此方法设定了研究问题,它显然就是一个逻辑斯蒂回归问题,但属于一个特例。这类问题的显著特征是,任何人会有好几次转变。同样明显的是,这类问题的结构形式与许多不可逆的转变结构的形式是一样的。例如,在犯罪学领域,从被捕到传讯、审判、定罪、宣判;在医学研究领域,某种疾病的不同阶段的转变,等等。我们解决这类结构形式问题的方法为,将所有的转变数据汇总成一个数据集,然后分析由转变所构成的样本而不是由人所构成的样本。
1702649671
1702649672 为了了解这是怎样做的,我们来介绍Treiman和Yamaguchi(1993)完成的一项日本教育获得的趋势分析。为了说明这种方法,我在这里只展示涉及日本在“二战”后从初中升高中、从高中升大专或大学的转变的部分分析内容。数据集包括1320名在战后期间完成教育的男性。因为在日本一直到初中都是义务教育,我们分析的基本对象是1320名初中毕业生,即这1320人都处在可以接受高中教育的“风险”中。其中,有1056人接受了高中教育,因此他们又处在继续升大专或大学的“风险”中。将那些处在第一次和第二次转变风险中的人汇总在一起,我们就得到了2376(=1320+1056)个转变可能性供研究。对于每一条记录,我们创建一个虚拟变量SUCCESS(S),如果发生转变就赋值为1,否则为0。我们用一个虚拟变量TRANSITION(T)来区分两种转变,从高中到大专或大学的转变赋值为1,否则为0。然后,我们估计一系列逻辑斯蒂回归方程,其因变量是成功发生转变的比率的自然对数,其自变量是转变变量,父母的地位变量、出生年份(用来研究趋势),以及变量之间的各种交互项。表13-4列出了教育转变进程的各类模型的拟合优度统计量,而表13-5报告了首选模型的参数。〔这项研究是在基于抽样设计的估计方法得到普遍应用之前进行的。因此,当时并没有考虑样本的整群特性。除了常见的数据在各抽样点聚集之外——这是全国性调查所具有的典型特征——转变比率模型(transition-ratio models)还是按人聚集的,因为发生在任何个人身上的转变很难是相互独立的。因此,除了要对整群样本做调整之外,对每个个体的观测也应该被看作是非独立的。〕
1702649673
1702649674 表13-4 日本教育转变进程的各类模型的拟合优度统计量(首选模型用黑体表示)
1702649675
1702649676
1702649677
1702649678
1702649679 从表13-4中我们看到,似然比和BIC都显示模型3拟合得最好。该模型假定家庭背景的影响在两次转变之间是不一样的,并且两次转变的比率随时间变化(但家庭背景的影响不随时间变化)。按照我们先前假设的观点——家庭背景的影响随转变进程而减小——模型2和模型1的比较尤其值得注意。模型1假定个体上升到更高受教育水平的比率受到父母社会地位的影响(具体来讲是受到父母受教育程度和父亲职业地位的影响,后者由职业声望来测量),但这一关系对各种转变来说是一样的。相比之下,模型2不仅假定转变的比率取决于所考察的是哪一次转变,而且假定家庭背景和实现某一转变的比率之间的关系也取决于所考察的是哪一次转变。模型2代表我们先前的假设。
1702649680
1702649681 表13-5 表13-4中模型3的参数
1702649682
1702649683
1702649684
1702649685
1702649686 正如我们所看到的,模型2远远好于模型1,但模型3更好,它进一步假定实现每次转变的比率存在历时变化。因此,我们的假设得到初步支持,而且我们也有转变进程随时间变化的证据(原文对这一点做了进一步探讨,但这里我们不需要考虑)。
1702649687
1702649688 现在看来,Treiman和Yamaguchi给出的那些模型比较并不完全令人满意。在模型1和模型2之间再加入一个模型或许会更好,即假定各次转变的成功比率之间存在差异,但将各次转变中家庭背景的影响限定为相同。困难在于我们不知道模型2优于模型1的原因是什么:是因为各次转变的实现比率不一样,还是因为家庭背景的影响在各次转变之间不一样,或者两者兼有。对出生年份的影响来说,也可以提出同样的问题——如果有一个介于模型2和模型3之间的模型会比较理想。
1702649689
1702649690 实际上,表13-4中的系数告诉我们的就是,假定家庭背景在不同转变中具有不同影响的模型比假定家庭背景在不同转变中具有相同影响的模型更好。为了证实我们的判断,我们需要检查表13-5中报告的参数以确定它们的符号与预期的相符。
1702649691
1702649692 表13-5报告了首选模型的参数。注意,我没有报告标准误或每个系数的p值。因为模型中所有的“主效应”也出现在“交互项”中,评估某个单一维度的合适方法是比较排除了反映此维度变量的模型与纳入该变量的模型。我在表13-4中已经这样做了,但只是做了选择性的比较,而没有给出每种可能的成对模型比较。〔Raftery论述过,S-Plus软件可以从包含一组指定变量的所有可能模型中选择最可能拟合数据的模型。有兴趣的读者可参考Raftery(1995a)。〕
1702649693
1702649694 注意,表13-5与表13-3在对标准误的处理上有所不同,在表13-3中我列出了标准误和p值。区别在于表13-3只有一个交互项,所以交互项的p值就表示包含和不包含交互项的两个模型拟合差异的显著性。如果一个模型既包含了单个的显著性检验有意义的变量,又包含了单个的显著性检验没有意义的变量——因为有交互项(或其他如平方项之类的转变)的影响,通常的做法是报告所有的显著性检验和p值。然而,为了避免不正确的解释,只报告那些有意义的显著性统计量更加可取。
1702649695
1702649696 此模型意味着,在日本,受教育水平从某一级到下一级的过程正如我们所期望的那样:每次转变的实现比率与父母的受教育水平和父亲的职业地位呈正相关。更有意思的是,交互项系数T×E和T×P都是负数,表示在此数据中家庭背景对教育转变进程的影响在高中升大学这一转变中比在初中升高中这一转变中要小。父母的平均受教育年限每增加一年使从初中升入高中这第一次转变的实现比率上升约40%(因为e0.3480=1.416),但使从高中升入大学这第二次转变的实现比率仅上升约35%(因为e(0.3480-0.0503)=1.347)。因此,举例来说,在所有其他因素都相同的情况下,一个大学毕业生的儿子继续就读高中的比率是一个初中毕业生的儿子的11倍以上(因为1.416(16-9)=11.414)。相比之下,在那些进入高中就读的学生中,大学毕业生的儿子继续就读大学的比率仅为初中毕业生的儿子的8倍〔因为1.416(0.951)(16-9)=8.030〕。类似地,父亲的职业声望每提高一个单位的净影响使第一次转变的实现比率上升约6%(因为e0.0569=1.059),但使第二次转变的实现比率仅上升4%(因为e(0.0569-0.0180)=1.040)。因此,举例来说,一个小店主(声望得分=42分)的儿子从初中升入高中的净比率是一个工人(声望得分=29分)的儿子的2倍多(因为1.059(42-29)=2.107)。但小店主的儿子从中学升入大学的净比率仅比工人的儿子高66%(因为1.040(42-29)=1.665)。出生年份以及转变与出生年份交互项的影响可用类似的方法解释。
1702649697
1702649698 提示一下,对模型中包含交互项的对数比率的解释完全与最小二乘回归中的解释相同(见第6章):系数可通过相加得到。然而,正如我们在第一个例子中看到的,系数取幂后(表示的是对比率比的贡献)并不是相加的,而是相乘的。因此,举例来说,父母受教育水平的系数对第一次转变来说是0.3480,对第二次转变来说是0.2977(=0.3480-0.0503)。相应地,系数取幂对第一次转变来说是1.4162,对第二次转变来说是1.3468(=1.4162×0.9509)。当然,1.3468=e0.2977。
1702649699
1702649700
1702649701
1702649702
[ 上一页 ]  [ :1.702649653e+09 ]  [ 下一页 ]