1702650221
表14-7 2000年美国成年人性生活模型的不同估计值(N=2258)(括号中是标准误;所有的系数在0.001或更高水平上统计显著)
1702650222
1702650223
1702650224
1702650225
1702650226
除了概率之外,我们还对三个预测值感兴趣:模型的线性预测(linear prediction)、删失预测(censored prediction)和删截预测(truncated prediction)。根据模型4对有婚姻关系的女性按年龄画出这些预测值,结果见图14-1。线性预测是从模型得到的潜变量预测,它告诉我们,在控制了其他因素之后,年龄每增加一岁,一年内的性生活次数大约下降2.3次。图14-1告诉我们,对有婚姻关系的女性来说,性生活次数在70岁左右时下降到每年不足一次。虽然负观测值没有意义,但线性预测给出了潜在或隐含变量的取值。我们可以认为此变量反映了性生活的倾向,它稳定地随着年龄的增加而下降(当然,这是因为我们将性生活次数模型化为年龄的一个线性函数)。
1702650227
1702650228
当因变量被观测时,删失预测等同于潜变量预测(latent prediction);当因变量存在删失时,删失预测就等于删失值。(Stata用“ystar”选项来得到删失预测,尽管Y*如公式14.12那样通常被用来表示潜在变量——这在某种程度上会令人感到困惑。)因此,在当前的例子中,我们假设0和208对于那些最低和最高值组别的人来讲就是真实值。根据建模规则,删失预测必须落在未删失观测的值域范围之内。
1702650229
1702650230
1702650231
1702650232
1702650233
图14-1 2000年美国有婚姻关系的女性年性生活次数期望值的三种估计(N=552)
1702650234
1702650235
删截预测只限于那些没有发生删失现象的观测。在这种情况下,删截预测对那些在过去一年有过性生活的人给出他们性生活次数的预测值。注意,删失预测和删截预测都不是线性的。因此,必须在自变量的特定取值上对这些预测值进行评估。一般情况下,我们感兴趣的是线性预测。
1702650236
1702650237
我们现在来看如何解释tobit系数,让我们将分析略微扩展到更加符合实际的情况。我增加了年龄的平方项以及年龄、性别和婚姻状态之间的交互项。正如在数据分析过程中所显示的那样,没有必要设定婚姻状态、性别分别与年龄和年龄平方的三维交互项;含三维交互项的模型在拟合性上并没有显著地优于只含两组二维交互项的模型——性别分别与年龄和年龄平方的二维交互以及婚姻状态分别与年龄和年龄平方的二维交互。此模型的系数可在下载文件“ch14_3.log”中看到。因为很难直接对它们进行解释,我针对每种性别—婚姻状态的组合画出了年龄与性生活次数之间的关系(见图14-2)。
1702650238
1702650239
1702650240
1702650241
1702650242
图14-2 2000年美国成年人按照性别和婚姻状态划分的年性生活次数的期望值(N=2258)
1702650243
1702650244
审视此图,我们看到,在同样的年龄和性别条件下,有婚姻关系的人比没有婚姻关系的人的性生活更加活跃——这并不出人意料,而且,性活动随年龄增加而下降的速率是逐渐加快的。
1702650245
1702650246
有趣的是,不管是在有婚姻关系还是在没有婚姻关系的组别中,在同样的年龄条件下男性报告的性生活次数都比女性多。对于同样婚姻状态组别中的这种性别差异,原因不是很清楚,但这可能反映了一种倾向——男性会夸大性活动,而(或者)女性会低报性活动。注意,如果只考虑异性性行为,那么男性和女性的平均性行为次数和平均性伴侣人数应该都是相同的。因此,显然存在有偏申报或不同的应答率(例如,一种可能的情况是,有多个性伴侣的女性——如妓女——在GSS的样本中过少);或者男性比女性报告了更多的同性恋情况。
1702650247
1702650248
有婚姻关系的男性和女性平均都只有一个性伴侣(准确地说是1.03个和0.99个),这意味着他们的配偶通常就是他们唯一的性伴侣,也就意味着他们的平均性行为次数应该是一样的——已经调整了他们在平均年龄上相差三年这一事实。然而,审视图14-2我们会发现,(期望值的)差异要大于年龄差所能解释的差异(如果年龄差能够完全解释,那么有婚姻关系的男性和女性的曲线应该是平行的,而且如果把男性的曲线平行于x轴往图形的左端移动三年的距离,它就会与女性的曲线重合)。这意味着有婚姻关系的男性和(或)女性按照合乎社会期望的方向虚报了他们的性生活次数——男性夸大性能力与女性强调性节制。虚报的可能性在没有婚姻关系的人群中大更多:平均来讲,没有婚姻关系的男性所报告的过去一年中性伴侣的人数大约是没有婚姻关系女性的2倍(1.85个相对于0.90个)——考虑到同性性行为上的差异无法解释这么大的差距——这说明没有婚姻关系的男性和女性有可能按照社会期望的方向虚报了性伴侣的数量和性生活的次数。一般来说,女性要比他们的男性伴侣更年轻这一事实也可能部分地解释了在没有婚姻关系的人群中男女两性所报告的性活动差异。要在这些可能性中做出判断,需要进行更加深入的分析。
1702650249
1702650250
1702650251
1702650252
1702650254
量化数据分析:通过社会研究检验想法 针对受限因变量的其他分析模型
1702650255
1702650256
本章的内容绝没有穷尽所有针对受限因变量的分析方法。Stata10.0提供了一系列执行命令,包括:
1702650257
1702650258
(1)条件逻辑斯蒂回归(conditional logistic regression)和混合模型(mixed models),其分析结果取决于结果变量的特征和(样本中的)个体特征。例子详见Boskin(1974)、Hoffman和Duncan(1988)、White和Liang(1998),以及Yanovitzky和Cappella(2001)。
1702650259
1702650260
(2)嵌套逻辑斯蒂回归(nested logistic regression),是通过将结果变量分成不同层次的方法对条件logit分析进行的扩展。例子详见Cameron(2000)、Soopramanien和Johnes(2001),及South和Baumer(2001)。
1702650261
1702650262
(3)Probit回归(Probit regression),是逻辑斯蒂回归的一种替代方法。简要介绍参见附录13.B。
1702650263
1702650264
(4)泊松回归(poisson regression),用来对计数变量即某一事件发生的次数进行建模。经典的例子是von Bortkiewicz于1898年对普鲁士军队中被马踢死的士兵人数的研究。在社会科学中的应用研究包括Long(1990)、Greenberg(1991)、Rasler(1996)、Chattopadhyay等(2006),及Weitoff等(2008)。关于泊松回归的权威性统计学说明,参见Cameron和Trivedi(1998)。
1702650265
1702650266
Long(1997)、Hosmer和Lemeshow(2000),以及Powers和Xie(2000)对上述许多方法做了很好的介绍,具有一般统计学知识背景的社会科学人员花些时间就能理解这些方法。Long和Freese(2006)提供了在Stata中使用这些方法的指南。关于这些方法的一个很有用的综述,参见Gould(2000)。
1702650267
1702650268
1702650269
1702650270
[
上一页 ]
[ :1.702650221e+09 ]
[
下一页 ]