1702650248
有婚姻关系的男性和女性平均都只有一个性伴侣(准确地说是1.03个和0.99个),这意味着他们的配偶通常就是他们唯一的性伴侣,也就意味着他们的平均性行为次数应该是一样的——已经调整了他们在平均年龄上相差三年这一事实。然而,审视图14-2我们会发现,(期望值的)差异要大于年龄差所能解释的差异(如果年龄差能够完全解释,那么有婚姻关系的男性和女性的曲线应该是平行的,而且如果把男性的曲线平行于x轴往图形的左端移动三年的距离,它就会与女性的曲线重合)。这意味着有婚姻关系的男性和(或)女性按照合乎社会期望的方向虚报了他们的性生活次数——男性夸大性能力与女性强调性节制。虚报的可能性在没有婚姻关系的人群中大更多:平均来讲,没有婚姻关系的男性所报告的过去一年中性伴侣的人数大约是没有婚姻关系女性的2倍(1.85个相对于0.90个)——考虑到同性性行为上的差异无法解释这么大的差距——这说明没有婚姻关系的男性和女性有可能按照社会期望的方向虚报了性伴侣的数量和性生活的次数。一般来说,女性要比他们的男性伴侣更年轻这一事实也可能部分地解释了在没有婚姻关系的人群中男女两性所报告的性活动差异。要在这些可能性中做出判断,需要进行更加深入的分析。
1702650249
1702650250
1702650251
1702650252
1702650254
量化数据分析:通过社会研究检验想法 针对受限因变量的其他分析模型
1702650255
1702650256
本章的内容绝没有穷尽所有针对受限因变量的分析方法。Stata10.0提供了一系列执行命令,包括:
1702650257
1702650258
(1)条件逻辑斯蒂回归(conditional logistic regression)和混合模型(mixed models),其分析结果取决于结果变量的特征和(样本中的)个体特征。例子详见Boskin(1974)、Hoffman和Duncan(1988)、White和Liang(1998),以及Yanovitzky和Cappella(2001)。
1702650259
1702650260
(2)嵌套逻辑斯蒂回归(nested logistic regression),是通过将结果变量分成不同层次的方法对条件logit分析进行的扩展。例子详见Cameron(2000)、Soopramanien和Johnes(2001),及South和Baumer(2001)。
1702650261
1702650262
(3)Probit回归(Probit regression),是逻辑斯蒂回归的一种替代方法。简要介绍参见附录13.B。
1702650263
1702650264
(4)泊松回归(poisson regression),用来对计数变量即某一事件发生的次数进行建模。经典的例子是von Bortkiewicz于1898年对普鲁士军队中被马踢死的士兵人数的研究。在社会科学中的应用研究包括Long(1990)、Greenberg(1991)、Rasler(1996)、Chattopadhyay等(2006),及Weitoff等(2008)。关于泊松回归的权威性统计学说明,参见Cameron和Trivedi(1998)。
1702650265
1702650266
Long(1997)、Hosmer和Lemeshow(2000),以及Powers和Xie(2000)对上述许多方法做了很好的介绍,具有一般统计学知识背景的社会科学人员花些时间就能理解这些方法。Long和Freese(2006)提供了在Stata中使用这些方法的指南。关于这些方法的一个很有用的综述,参见Gould(2000)。
1702650267
1702650268
1702650269
1702650270
1702650272
量化数据分析:通过社会研究检验想法 本章小结
1702650273
1702650274
我们在本章了解了如何对三种受限因变量进行模型估计:对序次变量适用序次logit模型;对多分类变量适用多项logit模型;对删失变量(高于或低于某些分界点的取值没有被观测到)适用tobit模型。
1702650275
1702650276
1702650277
1702650278
1702650280
量化数据分析:通过社会研究检验想法 第15章 改进因果推断:固定效应与随机效应模型
1702650281
1702650283
本章内容
1702650284
1702650285
在这一章,我们将学习两种密切相关的用于处理忽略变量偏误的技术。回顾第6章,当我们在模型中没有纳入影响结果变量且与一个或多个预测变量相关的变量时,就会发生忽略变量偏误。本章所讨论的用于估计无偏系数的技术被称为固定效应模型(fixed effects)和随机效应模型(random effects)。这两类模型使用两个或以上时点的相同个体信息,或者组内(家庭、学校、公司、社区或其他类似的组)两个或以上个体的信息,以排除估计方程中不随时间变化或在相同组内固定不变的所有特征,无论这些特征有没有被测量。结果是,我们能够测量的特征不会因为受到未被观测到的、不随时间变化的因素影响而出现偏误。有关这类技术的介绍,见Allison(2005)和Wooldridge(2006,第13、14章),本章内容主要来自他们的文献。
1702650286
1702650287
1702650288
1702650289
1702650291
量化数据分析:通过社会研究检验想法 引言
1702650292
1702650293
正如本书中的许多地方提到的,我们所学的非实验方法容易受到忽略变量偏误(omitted variable bias)的影响,即有可能存在未被测量到的因素同时影响预测变量和结果变量。在这种情况下,我们通过OLS或逻辑斯蒂回归估计到的系数将不正确。要更充分地理解这一点,一种行之有效的方法就是把我们所学的线性模型方法与随机实验进行比较。
1702650294
1702650295
在经典随机实验中,个体被随机地分为两组。实验组的成员会受到某种干预,而控制组的成员则不会;随后我们会测量这两组人在一种或多种结果上的差异(这种设计可以被泛化为包含几个不同实验组的情况,但其逻辑是相同的)。在一定的抽样误差内,因为实验组和控制组在干预前属性基本一致——或者说,个体是否接受干预与其实验前的属性不相关——所以我们可以认为,在任何结果上这两组之间的均值差异都是由干预引起的。
1702650296
1702650297
在用线性模型方法时,我们试图通过在统计上控制尽可能多的影响因素——与预测变量和结果变量都相关的因素——来模拟随机实验。例如,如果我们观测到男性比女性挣得多,我们就可能怀疑这是否源于歧视。然而,在接受这一结论之前,我们需要考虑,这种收入差异是否至少部分地源于男性更可能接受技术培训,进入高收入领域,具有更多的工作经验,且工作时间更长。然后我们在统计上控制这些变量,并在那些在控制变量上有同样取值的人群中评估性别对收入的影响。如果我们仍然发现不同性别在报酬上存在差异,那么我们可能就会将剩余的差异归结为歧视。但是,别人可能会质疑,认为我们并没有纳入其他可能引起报酬差异的关键因素。例如,女性可能在讨价还价上不如男性有效,因而比男性更容易接受收入水平较低的工作。如果我们忽略了对讨价还价能力的测量(或者,如果我们对讨价还价能力测量得不好,以至于真实的讨价还价能力仍有部分未被测量),那么这个因素所带来的所有影响都会被包含在误差项中。然而,如果讨价还价能力与性别相关,那么OLS(及其他线性模型)关于误差项与预测变量不相关的假设就会被违背,这样产生的系数就是有偏的。
[
上一页 ]
[ :1.702650248e+09 ]
[
下一页 ]