打字猴:1.702645325e+09
1702645325 量化数据分析:通过社会研究检验想法 [:1702644727]
1702645326 量化数据分析:通过社会研究检验想法 相加效应和交互效应
1702645327
1702645328 我们现在介绍交互效应,即一个变量对另一个变量的作用依第三个变量的取值而定。详细说明可参见表2-1。
1702645329
1702645330 表2-1 美国1965年分宗教派别和受教育程度的在一定条件下接受合法堕胎的百分比分布(N=1368;括号中是单元格频数)
1702645331
1702645332
1702645333
1702645334
1702645335 表2-1显示,1965年,在信奉天主教的人群中受教育程度对是否接受合法堕胎没有影响,而在信奉新教的人群中,受教育程度越高,接受合法堕胎的比例越高。因此,在受过高中以下教育的人群中,在一定条件下接受合法堕胎的比例在信奉天主教和信奉新教的人群中大致是一样的。但是,在受过更高教育的人群中,信奉新教的人比信奉天主教的人更可能接受合法堕胎。在受过高等教育的人群中,不同宗教信仰群体接受合法堕胎的比例整整相差20个百分点:在信奉天主教的人群中这一比例大约为31%,而在信奉新教的人群中这一比例则高达51%。
1702645336
1702645337 这种结果被为交互效应。宗教派别和教育获得之间产生的交互效应不同于每个变量单独产生的效应。也就是说,受教育程度和接受合法堕胎之间的关系在信奉天主教和信奉新教的人之间不一样,宗教派别和接受合法堕胎之间的关系因受教育程度的不同而不同。正如此处讨论的,当两个变量之间的关系取决于第三个变量的取值时,这被称为交互效应。在早期的调查分析文献中(例如,Lazarsfeld,1955;Zeisel,1985),交互效应有时被称为识别效应。宗教派别识别了受教育程度和堕胎观念之间的关系:信奉新教的人接受合法堕胎的程度随受教育程度的提高而提高,但信奉天主教的人接受合法堕胎的程度不随受教育程度发生变化。
1702645338
1702645339 HANS ZEISEL(1905~1992)以一本如何呈现统计表的经典著作——《用数字说话》(Say It with Figures)而闻名。此书已经刊印第六版,并被翻译成7种语言。Zeisel出生于捷克共和国,在维也纳长大和接受教育。在维也纳,他与Paul Lazarsfeld在私人生活和工作上都相互合作——两人都是青年社会运动家(the Young Socialists)的领导者。他们两人与Marie Jahoda一起合作,写了一本研究Marienthal(奥地利的一个小社区)失业的社会影响的经典著作([1933]1971)。Zeisel于1927年在维也纳大学获得法律学位。之后,他在那里从事法律工作,并进行社会研究。1938年,因纳粹德国吞并奥地利,他被迫逃亡到纽约。到纽约后,他在McCann-Erickson从事市场研究工作,之后转到Tea Council工作。1953年,他成为芝加哥大学法律系的教员,在那里他开展了大量有关“法律与社会”的实证研究。他是将统计事实和调查数据引入案例研究的先锋,并经常作为专家证人出庭。
1702645340
1702645341 当变量之间没有交互效应时,它们之间存在相加效应(或没有效应)。例如,假设表2-1中的数据如表2-2所示,结果会怎样呢?
1702645342
1702645343 表2-2 分宗教派别和受教育程度的接受合法堕胎的百分比分布(假想数据)
1702645344
1702645345
1702645346
1702645347
1702645348 我们可以得出两点结论:①不管受教育程度如何,宗教对接受堕胎的影响都是一样的。也就是说,在任何受教育程度上,信奉天主教和信奉新教的人接受合法堕胎的百分比差异都保持在10%。②不管是信奉天主教还是新教,受教育程度对接受合法堕胎的影响都是一样的。例如,对信奉天主教和新教的人而言,高中未毕业的人与高中毕业的人接受合法堕胎的百分比之差都是10%。类似地,对信奉天主教和新教的人而言,高中毕业的人与受教育程度为大学及以上的人接受合法堕胎的百分比之差都是20%。
1702645349
1702645350 此表之所以是相加的,是因为将每个变量的影响加到一起会产生最终的结果。样本中任何个人接受堕胎的概率至少为0.3(所以我们可以将0.3加到表中的每个单元格);信奉新教的人接受合法堕胎的概率比信奉天主教的人大0.1(因此,所有新教的单元格加0.1);高中未毕业的人接受堕胎的概率比高中以下的人高0.05(相应地,高中未毕业的单元格加0.05);高中毕业的人接受堕胎的概率比高中以下的人高0.15(因此,高中毕业的单元格加0.15);受教育程度为大学及以上的人接受堕胎的概率比高中以下的人高0.35(因此,受教育程度为大学及以上的单位格加0.35)。这样就得到表2-2的结果(将每个数值乘以100可以将比例转换成百分数)。
1702645351
1702645352 相比较而言,当变量之间存在交互效应时,表中每个变量的效应是不可能相加的,因为每个变量的效应依赖于其他某个自变量或一组自变量的值。
1702645353
1702645354 社会科学家感兴趣的许多关系都包含交互效应——特别是与性别、种族有关的一些效应,但实际上也存在一些可以相加的关系。现在尚无足够的理论能让我们很好地识别所研究的关系中哪些是相加的,哪些包含交互效应。
1702645355
1702645356 本书后面的章节将会介绍一些复杂的方法来区别交互效应和相加效应,并介绍如何通过对数线性分析和回归分析来处理各种交互效应。
1702645357
1702645358
1702645359
1702645360
1702645361 量化数据分析:通过社会研究检验想法 [:1702644728]
1702645362 量化数据分析:通过社会研究检验想法 直接标准化
1702645363
1702645364 我们经常希望估计在控制了其他变量后两个变量之间的关系。虽然我们已经知道如何估计偏相关(即一个或几个控制变量的各类别中两个变量之间的关系),但如果能在剔除或控制其他变量的影响后,再构建一张表示两个变量之间平均关系强度的表也非常有用。直接标准化,也可称为协变修正(covariate adjustment),就提供了这样一种方法。然而,因为此技术被广泛应用于人口学中,所以我使用该方法在人口学中常用的名称——直接标准化。需要注意的是,即使都称为标准化,直接标准化方法与标准化变量度量方法也是完全没有关系的。第5章将介绍如何对变量建立统一度量标准。
1702645365
1702645366 实例1:美国城市黑人中分激进类别与宗教信仰虔诚度的关系
1702645367
1702645368 一般情况下,通过具体事例来解释操作过程是最容易的,因此,让我们再次回顾第1章中表1-2至表1-6的分析(略有调整)。我们之前感兴趣的是,美国黑人的激进和宗教信仰虔诚度之间的关系是否被受教育程度所解释,即受教育程度较高的黑人更倾向于不信宗教且更激进。因为受教育程度不能完全解释激进和宗教信仰虔诚度之间的关系,所以要是有一种方法能表示在剔除了受教育程度的影响之后两者之间的关系将非常有用。为了达到这个目的,我们可以调整每一宗教信仰虔诚度类别中表现激进的百分比。具体来讲,用样本中受教育程度的总频数分布做权重,计算在每一宗教信仰虔诚度类别中表现激进的百分比的加权平均值。〔另一种方法和此方法在数学上完全一致,但先计算加权和(sum),之后用这个加权和作为每一类别的样本比例(proportion)的权重。〕通过这些计算,我们可以构建一张表,这张表显示了当所有的宗教信仰群体具有同样的教育分布时宗教信仰虔诚度和激进之间的关系。从这个角度来看,我们可以说这张表显示了在控制了受教育程度的影响后宗教信仰虔诚度与激进之间的关系。像前面提到的,此过程被称为直接标准化或协变修正。
1702645369
1702645370 需要注意的是,我们并不一定要用表的总分布作为权重,也可以用其他任何权重。例如,如果我们假设黑人具有和白人一样的教育分布,并在此基础上估计宗教信仰虔诚度和激进之间的关系,此时我们将白人视为标准人口(standard population),并用白人的教育分布(从其他数据来源得到)作为权重。下面我们将介绍采用这种策略的两个例子。
1702645371
1702645372 现在我们构建一张表来描述在调整了受教育程度或对其进行标准化后的宗教信仰虔诚度和激进之间的关系,以熟悉整个步骤。我们从表1-6的数据开始。首先,我们根据受教育程度的总体分布来得到标准分布。因为表中有993(=108+…+49)个样本,353(=108+201+44)人具有小学受教育程度,所以具有小学受教育程度的比例是0.356(=353/993)。类似地,具有高中受教育程度的比例是0.508,具有大学受教育程度的比例是0.137。这就是我们要用的权重。接着我们计算在调整后(或标准化)的非常虔诚的人群中表现激进的百分比。我们把“非常虔诚”这个人群继续划分为三组不同受教育程度的人,然后对这三组不同受教育程度表现激进的人的百分比进行加权求和(即表中第一行的数值),得到:17%×0.356+34%×0.508+38%×0.137=29%。为了标准化“有点虔诚”这一类中表现激进的人的百分比,我们对表中第二行的百分比使用同样的权重,得到22%×0.356+32%×0.508+48%×0.137=31%。最后,为了标准化“不怎么虔诚或根本不信教”类别中表现激进的人的百分比,对表中第三行使用同样的方法,其结果为45%。然后,我们比较标准化前后的百分比——标准化前的百分比,即宗教信仰虔诚度和激进之间零级相关(即没有控制受教育程度变量)时相应的百分比,结果如表2-3所示。〔计算这些结果的Stata-do-文件、命令-dstdize-和显示结果的-log-文件可以从出版商Jossey-Bass/Wiley的网站(www.josseybass.com/go/quantitativedataanalysis)下载。本章其余的例子也可以从这个网站下载到类似文件。因为我们还没有开始介绍相关的计算,所以读者现在只需要先了解这些资料的来源,在后面再学习这些计算方法——除非你们已经很熟悉Stata了。〕
1702645373
1702645374 Stata-do-文件和-log-文件 在Stata中,-do-文件记录命令,-log-文件记录-do-文件执行的结果。正如在后面第4章中你们将看到的那样,数据分析的管理是复杂的,而创建-do-文件将有助于管理数据分析。-do-文件不仅可以提高工作效率,而且可以永久保存生成的每张表或每个回归系数的计算过程。如果任何人想要重复几年前或几个月前执行的分析,他们就会体会到精确记录每个结果的计算过程是非常有价值的。
[ 上一页 ]  [ :1.702645325e+09 ]  [ 下一页 ]