打字猴:1.70264527e+09
1702645270
1702645271
1702645272
1702645273 图2-1 X和Y之间是完全虚假相关:当控制Z后,相关为0
1702645274
1702645275
1702645276
1702645277
1702645278 图2-2 X和Y之间是部分虚假相关:当控制Z后,X对Y的影响减弱(Z影响X,且Z和X共同影响Y)
1702645279
1702645280 干预变量
1702645281
1702645282 我们现在开始介绍干预变量。设想两个变量X和Y相关,仅仅因为X导致Z,而Z导致Y,如父亲的职业、儿子的受教育程度和儿子的收入之间的关系。假如我们期望X和Y之间的关系是正相关的——有时称为零级相关(zero-order association),简称零级偏相关(zero-order partial association),也就是说,不存在偏相关关系。例如,完全是因为这样的事实:父亲的职业地位影响儿子的受教育程度,进而儿子的受教育程度影响儿子的收入,因此我们认为,父亲的职业地位对儿子的收入没有直接影响,而只是通过儿子的受教育程度产生间接影响,如图2-3所示。
1702645283
1702645284
1702645285
1702645286
1702645287 图2-3 X和Y之间的相关完全被干预变量Z解释:当控制Z后,相关为0
1702645288
1702645289 但是,如前所述,除非我们有很强的理论支持X和Y之间不存在直接关系,不然,我们可能要通过数据来考察在控制干预变量Z后,X对Y的影响;同时考察在控制事前变量X后,Z对Y的影响。如图2-4所示。
1702645290
1702645291
1702645292
1702645293
1702645294 图2-4 X和Y之间的相关部分地被干预变量Z解释:当控制Z后,X对Y的影响减弱(X影响Z,且X和Z共同影响Y)
1702645295
1702645296 如果X和Y之间的净(net)或偏(partial)相关为0,那么我们可以得到如图2-3描绘的链式模型,否则,我们仅估计X和Y、Z和Y之间相关(出于完整性考虑,也可包括X和Z之间的零级相关)的强度和性质。
1702645297
1702645298 注意图2-2和图2-4之间的相似性,这两个模型的最终因变量Y是相同的。仅有的差别在于是Z导致X,还是X导致Z。也有另一种可能:X和Z共同导致Y,但是不清楚X和Z之间是否存在因果关系,如图2-5所示。
1702645299
1702645300
1702645301
1702645302
1702645303 图2-5 X和Z共同影响Y,但没有假设X和Z的因果顺序
1702645304
1702645305 在几乎所有的分析——包括已讨论的列联表、常规最小二乘多元回归模型、有关分类因变量的对数线性模型和逻辑斯蒂回归——中,图2-2、2-4和2-5所示的模型或理论在分析层次上是无法区分因变量Y的。因此,要区分它们必须根据研究者自己的想法,而不是通过数据决定。从数据操作的角度来看,三个模型都要求估计两个变量中的一个变量对第三个变量的净影响,即在控制了一个自变量后另一个自变量的影响。显然,这也适用于包含三个以上变量的情况。
1702645306
1702645307
1702645308
1702645309
1702645310 量化数据分析:通过社会研究检验想法 [:1702644726]
1702645311 量化数据分析:通过社会研究检验想法 抑制变量
1702645312
1702645313 这里要讨论的最后一点是抑制变量(suppressor variables)这个概念。到目前为止,我们讨论了这样两种情况:观测到的两个变量之间的相关关系是由第三个变量——事前变量或干预变量——引起的。然而,事实上,也存在这样的情形:两个变量看上去不存在相关关系,但其实这两个变量之间有因果联系。出现这种情况是因为存在一个与这两个变量都相关的其他变量抑制了这里观测到的零级相关。具体来讲,当一个自变量对另一个自变量的作用和它对因变量的作用方向相反,同时这两个自变量对因变量的作用方向也相反时,这种抑制效应就产生了,如图2-6所示。
1702645314
1702645315
1702645316
1702645317
1702645318 图2-6 当X对Z和Y的影响方向相反,以及X和Z对Y的影响方向相反时,X和Y之间(与Z和Y之间)零级相关的程度受到抑制
1702645319
[ 上一页 ]  [ :1.70264527e+09 ]  [ 下一页 ]