1702636136
1702636137
• 即使两个变量间有很强的相关性,也不一定意味着改变其中一个变量的值会引起另一个变量值的改变。
1702636138
1702636139
• 两个变量之间的相关性,常常受其他潜在变量的影响。
1702636140
1702636141
• 证明存在因果关系的最好证据,来自随机比较实验。
1702636142
1702636143
例6 看电视会延长人们的预期寿命吗?
1702636144
1702636145
统计一下世界各国人均拥有的电视机台数x和民众的预期寿命y,你会发现两者之间存在很强的正相关关系:人均拥有电视机数量多的国家,其民众的预期寿命也比较长。
1702636146
1702636147
因果关系的基本意义是,只要改变x的值,就可以使y的值改变。我们能不能运一堆电视机到博茨瓦纳,以延长那里的民众预期寿命呢?当然不行。富国的电视机数量比穷国多,而富国民众的预期寿命之所以长,是因为他们有较好的营养条件、干净的水以及较好的医疗资源。电视机数量与预期寿命之间没有因果关系。
1702636148
1702636149
例6说明了三大事实的头两项。这类相关被叫作“胡说相关”:相关是事实,胡说的部分是“改变其中一个变量的值会导致另一个变量值的改变”的结论。像例6中的国家财富这种潜在变量会同时影响x和y的值,形成x和y之间的强相关关系,即使x和y之间其实并没有什么直接的关系。我们称其为“共同反应”(common response),即解释变量和反应变量都会对某个潜在变量产生反应。
1702636150
1702636151
1702636152
1702636153
1702636154
“依照第三世界的新脱贫计划,援助组织今天开始送出100000台电视机。”
1702636155
1702636156
例7 女童肥胖症
1702636157
1702636158
是什么原因导致了儿童肥胖症?遗传因素、饮食无度、缺乏体育锻炼和看电视时间长都被视为解释变量。
1702636159
1702636160
一项对美籍墨西哥裔的9~12岁女童的研究结果具有一定的代表性。研究者测量了那些女童和她们母亲的身体质量指数(BMI),这是一个体重相对于身高的量度,BMI高的人偏重或肥胖。他们还记录了她们看电视的时间、体育锻炼的分钟数以及一些食物的摄入量。结果表明,女童的BMI与体育锻炼、饮食和看电视之间具有弱相关关系(r=-0.18),而较强的相关关系(r=0.506)存在于女童和她母亲的BMI之间。
1702636161
1702636162
体重部分取决于遗传因素。女儿的一半基因来自母亲,所以她们的BMI之间存在直接的因果关系。当然,这种因果关系并不完全。母亲的BMI只解释了女儿BMI的25.6%(r2)的变异值,该项研究测量的其他因素也影响了女童的BMI。
1702636163
1702636164
我们可以用例7中的r或r2说明有多少遗传因素对女童的BMI产生了影响吗?不能。还记得交叉影响吗?BMI高的母亲很可能给女儿做了少锻炼、过量饮食和长时间看电视的坏榜样,女童也有了这些坏习惯,从而遗传因素的影响和环境的影响混杂在一起。因此,我们无法说清楚母亲和女儿BMI之间的相关性有多少来自遗传因素。
1702636165
1702636166
图15-5表明如何用变量间的潜在联系来解释相关性。虚线代表变量x和y之间可以观察到的相关性,一些相关性可由变量间的直接因果关系解释。图15-5的第一个图用x到y的箭头表明“x造成了y”。第二个图表示的是共同反应,即x和y之间的相关性是由潜在变量z造成的。这种共同反应即便在x和y之间没有直接关系的情况下也可以构成相关性。第三个图展示了交叉影响,解释变量x和潜在变量z可能一起影响了反应变量y。变量x和z之间是相关的,所以无法区分出z和x各自对y产生的影响。
1702636167
1702636168
在例7中,母亲和女儿的BMI之间存在着因果关系。尽管如此,研究测量的其他一些因素也影响了女儿的BMI。这是一个交叉影响的例子,在图15-5的(c)上,x代表母亲的BMI,z代表其他因素,y代表女儿的BMI。
1702636169
1702636170
1702636171
1702636172
1702636173
图15-5 相关性的解释。虚线表明相关性,箭头代表直接的因果关系。x是解释变量,y是反应变量,z是潜在变量
1702636174
1702636175
共同反应和交叉影响都包含了潜在变量z对反应变量y的影响。我们无法区分这两种关系的不同,只能记住,在考虑变量之间的关系时,一个值得汲取的建议是“留意潜在变量”。
1702636176
1702636177
例8 学术能力评估测试分数和大学的学习成绩
1702636178
1702636179
在学术能力评估测试中,得高分并不意味着在大学也会取得好成绩。两者之间的相关性(r2是27%)表明学习能力、习惯和保持头脑清醒等变量在其中共同发生作用。图15-5(b)展示了这种情况,z代表学习能力,x代表学术能力评估测试分数,y代表大学的成绩。
1702636180
1702636181
在学术能力评估测试中,考高分的能力部分预测了大学的学习表现,但二者之间不是因果关系。我们只需要知道学术能力评估测试分数和大学成绩在过去几年的关系,将继续对今年的高中毕业生有效。再想想前面讲过的始祖鸟化石的例子,股骨长度很准确地预测了肱骨长度。这种强相关关系可以用始祖鸟的年龄和体型大小的共同反应来解释。因此,预测并非一定要有因果关系。
1702636182
1702636183
以上例子的讨论带来了更多关于因果关系的事实:
1702636184
1702636185
统计数据与因果关系(续)
[
上一页 ]
[ :1.702636136e+09 ]
[
下一页 ]