1702645275
1702645276
1702645277
1702645278
图2-2 X和Y之间是部分虚假相关:当控制Z后,X对Y的影响减弱(Z影响X,且Z和X共同影响Y)
1702645279
1702645280
干预变量
1702645281
1702645282
我们现在开始介绍干预变量。设想两个变量X和Y相关,仅仅因为X导致Z,而Z导致Y,如父亲的职业、儿子的受教育程度和儿子的收入之间的关系。假如我们期望X和Y之间的关系是正相关的——有时称为零级相关(zero-order association),简称零级偏相关(zero-order partial association),也就是说,不存在偏相关关系。例如,完全是因为这样的事实:父亲的职业地位影响儿子的受教育程度,进而儿子的受教育程度影响儿子的收入,因此我们认为,父亲的职业地位对儿子的收入没有直接影响,而只是通过儿子的受教育程度产生间接影响,如图2-3所示。
1702645283
1702645284
1702645285
1702645286
1702645287
图2-3 X和Y之间的相关完全被干预变量Z解释:当控制Z后,相关为0
1702645288
1702645289
但是,如前所述,除非我们有很强的理论支持X和Y之间不存在直接关系,不然,我们可能要通过数据来考察在控制干预变量Z后,X对Y的影响;同时考察在控制事前变量X后,Z对Y的影响。如图2-4所示。
1702645290
1702645291
1702645292
1702645293
1702645294
图2-4 X和Y之间的相关部分地被干预变量Z解释:当控制Z后,X对Y的影响减弱(X影响Z,且X和Z共同影响Y)
1702645295
1702645296
如果X和Y之间的净(net)或偏(partial)相关为0,那么我们可以得到如图2-3描绘的链式模型,否则,我们仅估计X和Y、Z和Y之间相关(出于完整性考虑,也可包括X和Z之间的零级相关)的强度和性质。
1702645297
1702645298
注意图2-2和图2-4之间的相似性,这两个模型的最终因变量Y是相同的。仅有的差别在于是Z导致X,还是X导致Z。也有另一种可能:X和Z共同导致Y,但是不清楚X和Z之间是否存在因果关系,如图2-5所示。
1702645299
1702645300
1702645301
1702645302
1702645303
图2-5 X和Z共同影响Y,但没有假设X和Z的因果顺序
1702645304
1702645305
在几乎所有的分析——包括已讨论的列联表、常规最小二乘多元回归模型、有关分类因变量的对数线性模型和逻辑斯蒂回归——中,图2-2、2-4和2-5所示的模型或理论在分析层次上是无法区分因变量Y的。因此,要区分它们必须根据研究者自己的想法,而不是通过数据决定。从数据操作的角度来看,三个模型都要求估计两个变量中的一个变量对第三个变量的净影响,即在控制了一个自变量后另一个自变量的影响。显然,这也适用于包含三个以上变量的情况。
1702645306
1702645307
1702645308
1702645309
1702645311
量化数据分析:通过社会研究检验想法 抑制变量
1702645312
1702645313
这里要讨论的最后一点是抑制变量(suppressor variables)这个概念。到目前为止,我们讨论了这样两种情况:观测到的两个变量之间的相关关系是由第三个变量——事前变量或干预变量——引起的。然而,事实上,也存在这样的情形:两个变量看上去不存在相关关系,但其实这两个变量之间有因果联系。出现这种情况是因为存在一个与这两个变量都相关的其他变量抑制了这里观测到的零级相关。具体来讲,当一个自变量对另一个自变量的作用和它对因变量的作用方向相反,同时这两个自变量对因变量的作用方向也相反时,这种抑制效应就产生了,如图2-6所示。
1702645314
1702645315
1702645316
1702645317
1702645318
图2-6 当X对Z和Y的影响方向相反,以及X和Z对Y的影响方向相反时,X和Y之间(与Z和Y之间)零级相关的程度受到抑制
1702645319
1702645320
例如,你们要研究受教育程度、收入和生育这三个变量之间的关系。从理论上讲,你们可能期望得到下述结论:受教育程度对收入有正面影响;在控制收入之后,受教育程度对生育有负面影响 〔这是因为相对于没有受过良好教育的人来说,受过良好教育的人更希望为孩子带来更多的好处,更可能认为养孩子成本更高(或更昂贵),因此,在任意给定收入水平的情况下,受过良好教育的人的孩子数较少〕;在控制受教育程度之后,收入越高,孩子数越多(这是因为在一般情况下,人们想要孩子,因此,在任意给定孩子的可见成本水平的情况下,那些收入更高的人会有更多的孩子)。这些关系如图2-6所示,其中X=受教育程度,Z=收入,Y=孩子数。有意思的是,图2-6意味着根据三个变量之间相关的相对大小,X和Y、Z和Y之间的总相关或零级相关将会弱于净相关或一阶偏相关,甚至为0。为了说明这是如何发生的,设想受教育程度和生育之间的关系。我们已经假定受过良好教育的人会有较高的收入,且在任意给定受教育程度的情况下,收入越高的人倾向于要更多的孩子。据此,我们可以预测受教育程度和生育之间的关系是正的。但是,我们也假定在任一收入水平下,受教育程度越高的人倾向于要更少的孩子。因此,我们同时有一个正向的因果路径和一个负向的因果路径,并且这两个效应相互抵消或抑制,这就导致了受教育程度和生育之间的零级相关关系减弱。
1702645321
1702645322
1702645323
1702645324
[
上一页 ]
[ :1.702645275e+09 ]
[
下一页 ]