1702645246
本章内容
1702645247
1702645248
本章将从应用上和技术上增进我们对列联表分析的理解。第一,我们会继续探讨分析的逻辑,即在分析中继续引入更多的变量;第二,我们介绍一种被称为抑制效应(suppressor effect)的特殊情况,即当两个自变量的影响相互抵消的情况;第三,我们介绍变量如何联合产生特殊效应,即如何区分相加效应(additive effects)和交互效应(interaction effects);第四,我们将介绍如何通过直接标准化的方法(direct standardization)来估计在多元百分数表中在控制其他自变量后一个变量的影响;第五,我们介绍实验(experiments)和统计控制(statistical controls)之间的区别。
1702645249
1702645250
1702645251
1702645252
1702645254
量化数据分析:通过社会研究检验想法 分析的逻辑
1702645255
1702645256
在调查研究方法的传统做法中(如Lazarsfeld,1955;Zeisel,1985),我们习惯上把第三个变量完全或部分地解释了两个变量之间的相关关系区分成两种情况:虚假(spurious)相关和能够被一个干预(intervening)变量或一组干预变量解释的相关。这两者的区别在于,当一个控制变量(Z)从时间上或因果关系上发生在另一个自变量(X)和因变量(Y)之前,并且控制变量完全或部分地解释了自变量和因变量之间的相关关系时,我们推论在自变量和因变量之间不存在因果关系或仅存在弱的因果关系。然而,当控制变量在时间上或因果关系上处于自变量和因变量之间时,我们就不能够声称自变量和因变量之间不存在因果关系;相反,这种情况表示,此干预变量解释了或有助于解释自变量如何对因变量产生影响。我们在前一章中介绍了虚假相关,在本章中,我们将继续介绍虚假相关,同时介绍干预变量的影响。
1702645257
1702645258
PAUL LAZARSFELD(1901~1976)是推动调查研究成为美国社会学界数据收集主要方法的奠基人——可能也是最杰出的人物。Paul Lazarsfeld出生在维也纳,获得数学博士学位(论文是有关数学视角下的爱因斯坦万有引力理论)。他涉足社会学是因为1926年与Marie Jahoda结婚,并同她(和Hans Zeisel)一起参与到日后成为经典的Marienthal研究中(见本章后面Zeisel的简历)。虽然他与Jahoda的婚姻没能天长地久,但是他对社会科学的兴趣却终其一生。1933年他来到美国,在Newark大学(现在是Rutgers大学的一部分)找到第一份工作,随后在哥伦比亚大学建立了应用社会研究部。这个应用社会研究部不仅培养了许多杰出的社会科学家,而且还成为量化数据收集和分析方法的创新基地。Lazarsfeld标志性的理念之一是,使社会研究最有效的方法是发挥集体智慧,即各方面的专家一起合作。但是,也许最重要的是,他一贯认为解决实际问题是社会学界的根本任务,且回答此类问题能促进学科的理论发展。
1702645259
1702645260
虚假相关
1702645261
1702645262
假设有三个变量X、Y和Z,我们观察到X和Y之间存在相关,但怀疑这种相关关系可能完全是因为X和Y都分别与Z相关。(一个实际例子如前一章提到的假设,宗教信仰虔诚度和激进之间存在负相关关系是因为两者都与受教育程度有关——黑人的受教育程度越高,则越不信教且越激进。)这一假设如图2-1所示。
1702645263
1702645264
本书都使用这类因果关系图来解释、说明各种关系。因果关系图被广泛地用于路径分析(path analysis)——一种表达和以代数形式使用结构方程模型的方法。结构方程模型曾在20世纪70年代非常流行,但现在已较少使用(见第16章对结构方程模型和路径分析更为深入的讨论)。我在这里使用此类模型纯粹是探索性的。尽管如此,我在使用它们时也力求概念完整。因此,从x到X(pXx)和从y到Y(pYy)的路径表示除Z之外的其他变量对X和Y的影响。
1702645265
1702645266
现在,如果在Z的各类别内,X和Y之间的相关很弱或不存在,我们就可以认为X和Y之间的相关完全被它们与Z的相关所解释。然而,这种情况一般不会发生。例如,在控制了受教育程度之后,宗教信仰虔诚度和激进之间仍存在负相关。除了我们有很强的理论支持某种关系是完全的虚假相关,我们通常不会要求做要么全有要么全无的虚假相关假设。相反,我们会问,在控制Z之后,X和Y之间是什么关系(以及在控制X之后,Z和Y之间是什么关系)。我们的分析逻辑如图2-2所示。
1702645267
1702645268
换个角度来说,我们不去假设X和Y之间的因果关系为0并去检验这个假设是否正确,而是估计在控制Z之后X和Y之间的关系及其程度大小——当然,这可能为0,如图2-1和图2-2所示。当估计在控制Z之后X和Y之间的相关为0时,图2-1和图2-2是完全相同的。
1702645269
1702645270
1702645271
1702645272
1702645273
图2-1 X和Y之间是完全虚假相关:当控制Z后,相关为0
1702645274
1702645275
1702645276
1702645277
1702645278
图2-2 X和Y之间是部分虚假相关:当控制Z后,X对Y的影响减弱(Z影响X,且Z和X共同影响Y)
1702645279
1702645280
干预变量
1702645281
1702645282
我们现在开始介绍干预变量。设想两个变量X和Y相关,仅仅因为X导致Z,而Z导致Y,如父亲的职业、儿子的受教育程度和儿子的收入之间的关系。假如我们期望X和Y之间的关系是正相关的——有时称为零级相关(zero-order association),简称零级偏相关(zero-order partial association),也就是说,不存在偏相关关系。例如,完全是因为这样的事实:父亲的职业地位影响儿子的受教育程度,进而儿子的受教育程度影响儿子的收入,因此我们认为,父亲的职业地位对儿子的收入没有直接影响,而只是通过儿子的受教育程度产生间接影响,如图2-3所示。
1702645283
1702645284
1702645285
1702645286
1702645287
图2-3 X和Y之间的相关完全被干预变量Z解释:当控制Z后,相关为0
1702645288
1702645289
但是,如前所述,除非我们有很强的理论支持X和Y之间不存在直接关系,不然,我们可能要通过数据来考察在控制干预变量Z后,X对Y的影响;同时考察在控制事前变量X后,Z对Y的影响。如图2-4所示。
1702645290
1702645291
1702645292
1702645293
1702645294
图2-4 X和Y之间的相关部分地被干预变量Z解释:当控制Z后,X对Y的影响减弱(X影响Z,且X和Z共同影响Y)
[
上一页 ]
[ :1.702645245e+09 ]
[
下一页 ]