打字猴:1.702647668e+09
1702647668
1702647669
1702647670
1702647671
1702647672 但是,用表7-9中的系数无法对黑人与其他种族的教育获得决定因素进行正式的比较。要了解这一点,我们来看表7-10,它是对黑人和非黑人在完成的平均受教育年限上近一年的差异进行分解后的结果。分解1是将黑人作为比较标准,由方程7.48建构而来;分解2则是以非黑人为比较标准,由方程7.49建构而来。两种分解都是将非黑人作为组1、黑人作为组2。因此,分解的是非黑人与黑人相比在平均受教育年限上多出约一年的优势。两个分解结果都意味着“禀赋”上的差异——非黑人母亲的受教育年限较长、兄弟姐妹数较少、居住在南方的可能性较小这些事实——比“禀赋”回报上的差异更重要。但是两种分解结果得出的母亲的受教育年限和兄弟姐妹数差异的贡献程度有所不同,在分解2中,这两个因素都显得更加重要。其原因是显而易见的:当黑人作为比较标准时——当黑人/非黑人在斜率上的差异是以黑人的均值为基础来进行评价时——黑人和非黑人在母亲的受教育年限和兄弟姐妹数这两个变量期望值上的差异要小于以非黑人的均值为基础进行评价时所得到的相应数值。(为了使自己确信这一点,你们可以针对这两个变量的斜率分别作图,并将黑人与非黑人的斜率差异在同一张图中反映出来。)最后,交互项在此分解结果中相对不重要,因为兄弟姐妹数与居住在南方的影响相互抵消了。
1702647673
1702647674 表7-10 1990~2004年美国成年人中非黑人与黑人平均受教育年限之差的分解
1702647675
1702647676
1702647677
1702647678
1702647679 分解均值间差异的补充读物
1702647680
1702647681 为了更好地理解如何进行更加复杂的分解以及如何对分解结果进行解释,请阅读下面的文章:Duncan(1968)、Winsborough和Dickinson(1971)、Kaufman(1983)、Treiman和Roos(1983)、Jones和Kelley(1984)、Kraus(1986)、Treiman和Lee(1996)以及Treiman、McKeever和Fodor(1996)。
1702647682
1702647683
1702647684
1702647685
1702647686 量化数据分析:通过社会研究检验想法 [:1702644774]
1702647687 量化数据分析:通过社会研究检验想法 本章小结
1702647688
1702647689 我们在本章介绍了多元回归分析的各种应用,这有助于我们提高阐释社会过程和检验社会理论的能力。具体来说,我们介绍了因变量和自变量的非线性转换,在一个方程中检验系数等价性的方法,如何评估某一关系的线性假设是否成立,如何构建和解释反映斜率突然变化的线性样条,表示虚拟变量系数的不同方法,以及分解两个均值之差的方法。几个关注历时趋势的具体例子向我们示范了怎样用多元回归方法来研究社会变迁。
1702647690
1702647691 我们在下一章将讨论在非实验性质的社会研究中或许是最令人头痛的问题——某些变量而非所有变量存在缺失数据,并且介绍当前被认为是处理缺失数据的最佳方法——缺失值的多重填补法。
1702647692
1702647693
1702647694
1702647695
1702647696 量化数据分析:通过社会研究检验想法 [:1702644775]
1702647697 量化数据分析:通过社会研究检验想法 第8章 缺失数据的多重填补法
1702647698
1702647699 量化数据分析:通过社会研究检验想法 [:1702644776]
1702647700 本章内容
1702647701
1702647702 我们在本章介绍有关处理缺失数据的一些问题。我们会回顾处理缺失数据的多种方法,并且了解如何使用当前最先进的填补缺失数据的方法,即多重填补法(multiple imputation),以创建一个完整的数据集。有关有用的填补法的综述,请见Paul等人(2008)的著作,这里的讨论主要来自他们的著作。其他关于缺失数据处理的有用的文献包括Anderson、Basilevsky和Hum(1983),Little(1992),Brick和Kalton(1996),以及Nordholt(1998)。
1702647703
1702647704
1702647705
1702647706
1702647707 量化数据分析:通过社会研究检验想法 [:1702644777]
1702647708 量化数据分析:通过社会研究检验想法 引言
1702647709
1702647710 缺失数据是社会研究中一个让人头痛的问题。虽然这种问题很常见,但处理起来却很困难。大多数调查选项中都包含一些无应答的类别,如受访者不知道一些问题的答案或拒绝回答,或者是调查者因疏忽跳过问题或记录无效编码,或者是在键入数据时犯错,等等。行政数据、医院记录,以及其他类型的数据具有类似的问题,如在某些项目上的无效或缺失应答。如果信息出现缺失是因为它对特定的受访者不适用(例如,未婚者的结婚年龄),那么数据缺失不会造成任何问题;因为分析样本会仅仅被定义为那些处于事件“风险”中的人。但是,在其他情况下(原则上应该有应答),如果出现缺失,我们就需要使用特殊程序来处理缺失信息。
1702647711
1702647712 有关缺失数据的统计学文献(Rubin,1987;Little and Rubin,2002)明确区分了三种情况:完全随机缺失(missing completely at random,MCAR)数据,其条件是,对某一特定变量的缺失应答独立于解释模型中任何其他变量的数值和问题中变量的真实值;随机缺失(missing at random,MAR)数据,其条件是,缺失值独立于问题中该变量的真实值,但不独立于解释模型中的某些其他变量;非随机缺失(missing not at random,MNAR)数据,或者说是不可忽略(nonignorable,NI)缺失数据,其条件是,缺失值依赖于问题中变量的真实值,且可能依赖于其他变量。
1702647713
1702647714 注意,这些区分是针对净效应的。也就是说,如果父亲的受教育年限数据缺失和受访者的受教育年限相关,但在控制了受访者的受教育年限之后,父亲受教育年限数据的缺失值和父亲受教育年限的真实值无关,此数据就满足MAR条件。在以上三类划分中用净效应而不用总效应是非常重要的,否则我们将很难找出满足MAR条件的变量。例如,可能父亲受教育年限的缺失值与父亲受教育年限的真实值有关仅仅是因为父亲的受教育年限和受访者的受教育年限相关,而且受教育年限短的受访者比受教育年限长的受访者更可能不知道自己父亲的受教育年限信息。
1702647715
1702647716 不幸的是,至少在截面数据中,没有经验性的方法可用来判断缺失值是否独立于变量的真实值,这使我们必须依赖理论背景的支持。虽然缺失值可能很少完全独立于变量的真实值,但在很多情况下,我们假设在控制了解释模型中的其他变量后这种独立在很大程度上存在也是合理的。这是我们需要关注的。
1702647717
[ 上一页 ]  [ :1.702647668e+09 ]  [ 下一页 ]