1701565220
1701565221
相关系数可以用来测量两个变量之间线性联系的程度。例如,智商与学习成绩之间的相关度恰好是0.5左右,也就是说两者的联系较强。不过智商与学习成绩之间至少应该具备相当的关联度,因为设计智力测试就是为了预测人们在学校内的学习成绩。相关系数的变化范围是–1到+1之间,–1表示两个变量完全成反比,+1表示两个变量完全成正比。相关系数为0就意味着两个变量之间没有任何联系。相关系数也可以用来衡量效果值的大小,或者关联度的大小。相关系数的数值小于0.3就是较小的相关度,0.3~0.5就是中等大小的相关度,在0.5以上就是较大的相关度。但是,和效果值一样,关联度是否重要取决于关联度中的变量,而不是相关度的大小。我们也可以用标准差的概念来解释相关系数。如果两个变量的相关度是0.25,那么第一个变量增加1个标准差,第二个变量就会增加0.25个标准差;如果相关度是0.5,那么第二个变量就会增加0.5个标准差。如果班级的规模与学生在标准化考试中的成绩之间的相关度是–0.25,那么班级规模缩小1个标准差,学生的考试成绩就应该提高0.25个标准差(假设班级规模与考试成绩之间确实存在因果关系)。
1701565222
1701565223
多元回归是一种分析方法,它能够找出一些因变量(或预测变量)与结果变量(或某个目标变量)之间的关系。例如,我们或许想要比较哪些变量能够最大限度地预测一所房子在房地产市场上的吸引力。我们可能会衡量房屋的面积有多少平方米,有几间卧室,卫生间的舒适程度(例如水池的数量、是否能洗热水澡、使用的材料质量好坏等),小区的平均收入,以及由潜在买主的数量代表的房屋的抢手程度。然后我们将这些变量同时与房屋在市场上的吸引力联系在一起,也就是房屋在市场上的售价——目标变量。不考虑所有其他变量对房屋价值的贡献度(即将所有其他变量设为常数)的条件下,找出某个变量与市场价值之间相关度的大小,就可以估计出这个变量对于房屋市场价值的贡献度。因此,当将所有其他变量设为常数时,房屋的抢手程度与市场价值之间的相关度可能是0.25,卫生间的舒适程度与市场价值之间的相关度可能是0.1。不过所有这些变量之间都存在一定的相关度,并且对某些变量的测量可能比其他变量更为准确,某些变量可能与其他一些变量存在一定的因果关系,而与另一些变量不存在因果关系,有些没有测量的变量或许会对一些得到测量的变量产生一定的影响。这就导致多元回归的结果有可能对我们产生误导。房屋的抢手程度与市场价值之间的实际相关度,可能远远高于多元回归分析得出的0.25,也可能远远低于0.25。
1701565224
1701565225
有无数个例子能够说明,多元回归分析得出的因果关系,往往与实验得出的因果关系不一致。从因果推论的角度来看,这些实验几乎都比多元回归分析更加可取。例如,大概在15年前,我曾经参加过全美卫生研究院召开的共识发展会议。这次会议的目的就是要重新审视关于冠状动脉阻滞的治疗方法的研究,究竟是临床治疗还是手术治疗效果更好,并就这两种治疗方法的适当性达成共识。要审查的研究中有大量研究都是由政府资助的,耗资巨大。在这些研究中,研究人员将大量和患者有关的变量放入一个多元回归方程式中,例如病史、年龄以及社会经济地位等,然后在不考虑不同患者使用的其他治疗方法的情况下,确定某种治疗方法的疗效。但是由于美国管理研究政策的内部审查委员会要求,必须给予患者选择治疗方法的自由(不过我们并不能确定这样做实际上是否真的符合患者的利益),所以所有的实验证据都因为带有自我选择的人为因素而动摇了。不过除了美国的研究以外,还有两项欧洲的研究,都达到了随机为患者安排各种治疗方法的标准。因此,专门小组的成员放弃了耗资巨大的美国研究,只对两项欧洲研究的结果进行了分析。
1701565226
1701565227
让我们再考虑一个与本书更为相关的例子,那就是班级规模是否真的会影响学习成绩。多元回归分析告诉我们,不考虑学校的规模、学校所在社区全部家庭的平均收入、教师的薪酬、具备资格的教师的比例,以及学区内每名学生的教育支出等因素,规模一般的班级与学生的学习成绩之间没有联系。在另外一项随机选取研究对象并实施得很好的研究中,进行比较的班级学生人数相差很多(将有13~17名学生的班级与有22~25名学生的班级进行比较)。结果这项研究发现,将班级人数缩减至13~17人,学生们在标准化考试中的成绩提高了0.25个标准差以上——这对黑人孩子起到的作用也大于白人孩子(1999年)。这不仅仅是另外一项有关班级规模的影响的研究,它还取代了所有有关班级规模的多元回归研究。
1701565228
1701565229
在本书中我偶尔会提到多元回归研究,不过每次都会提醒大家注意研究的结果。
1701565230
1701565231
自我选择是相关性研究和多元回归分析面临的难题之一。有很多原因要求我们必须要对自我选择有所了解。如果我们说智力与未来的职业成就之间具有一定的相关度——比如0.4,那么大家往往就会条件反射地认为,这样的关系完全是因果关系——智商更高的人工作能力也更强。但是智力与其他因素也是相关的,例如智商较高的孩子通常其父母的社会经济地位也较高。如果父母的社会经济地位较高,那么不论这个孩子智商高低,都更有可能念大学。同样,不论这个孩子的智商高低,拥有大学学历就有可能获得更高的职业地位。因此,智力与职业成就之间的关联就受到了其他因素的影响,例如父母的社会经济地位以及大学学历,那么这个孩子,或是研究的对象,就具备了“自我选择”的自由。(说一个人“自我选择”了父母的社会经济地位恐怕并不恰当,因为显然这是不可能的。但是由于真正进行比较的研究人员不能决定这个变量的大小,所以就好像是研究对象决定了这个变量的大小。总之,一些与研究对象有关的变量是研究人员无法控制的,其大小也不能由他们选择,有时他们甚至不知道这些变量的变化。)
1701565232
1701565233
只要一项研究仅对一个特定的变量进行测量而不是控制,我们就一定要注意到,对测量的变量(以及所有其他测量或不测量的变量)的大小进行选择的是研究对象,而不是研究人员。这就在很大程度上限制了推理的准确性。在班级规模的例子中,研究人员使用了多元回归的方法,使得班级规模这个变量的大小可以进行自我选择(也就是说,研究人员不决定班级规模的大小),并且班级规模这个变量也许与其他各类变量都有联系,这些变量有可能会扩大或限制班级规模对于学习成绩的影响。能够完全避免自我选择问题的唯一方法,就是让研究人员来选择因变量或预测变量的大小(例如,是人数较多的班级还是人数较少的班级),然后观察因变量或预测变量对目标变量的效果(例如成就测试的成绩)。由于不是总能做到这一点,所以我们只好满足于相关性分析和多元回归分析,同时对自我选择的问题保持警戒。
1701565234
1701565235
最后,统计显著性告诉我们,如果一项计划实际上并没有任何效果,那么研究得出的效果值——例如班级规模对于学习成绩的效果——就有可能是偶然产生的。按照惯例,如果统计显著性的值为0.05,这就是说,在与进行的研究设计相同的研究中,两个平均数之间的差距或某个特定大小的相关度在100次统计中只有5次出现的概率,或者20次中只有一次出现的概率。不过统计显著性在很大程度上取决于观测值的数量。如果观测值数量足够多,那么即使在实践中或理论上小到不具备任何意义的差距,在统计学上也可能会很重要。我在本书中提到的任何一项研究所得出的结果,其统计显著性都达到了低于0.05的水平。只有一项我称为“不太重要”的研究结果,其发生的概率低于0.1,这项研究的结果有可能是偶然获得的。
1701565236
1701565237
1701565238
1701565239
1701565241
认知升级:重塑思维与认知,实现自我进化 附录二 黑人与白人的智力差异完全由环境所致的论据
1701565242
1701565243
在这个附录中,我会列举出证明黑人与白人的智力差异主要由基因所致的依据,并逐一进行驳斥。理查德·赫恩斯坦和查尔斯·莫瑞(1994年)合著的《钟形曲线》中有关种族和智力的一章,以及菲利普·拉什顿和阿瑟·詹森(2005年)最近的一篇文章中,都提出了遗传基因造成黑人与白人智力差异的论据。而且对于下列基因决定论的观点,不少科学家或多或少都抱着支持的态度。
1701565244
1701565245
1. 白人的智力遗传度很高。因此,有可能黑人与白人的智力差距中的一大部分都应该归结于遗传基因。
1701565246
1701565247
2. 有些智力测验宣称与文化无关,例如涉及对不同几何图形之间的关系进行分析的测试。有的测试与文化有很大关系,例如找出沙龙舞和方块舞之间的相似之处。黑人与白人在前一种测试中的差距,大于两者在后一种测试中的差距,所以这种差距不太可能是文化原因造成的。
1701565248
1701565249
3. 撒哈拉沙漠以南的黑人的智商(赫恩斯坦和莫瑞1994年的测量结果是75分,拉什顿和詹森2005年测量的结果是70分)比非裔美国人更低。非裔美国人的智商(一般认为是85分)比较高是因为他们的基因库里有大约20%的欧洲基因。
1701565250
1701565251
4. 黑人在所谓的g(一般智力的g因素)负荷量较高的试题上的表现,不如在g负荷量较低的试题上的表现,而在g负荷量较高的试题上的表现,比在g负荷量较低的试题上的表现更易受到遗传基因的影响。
1701565252
1701565253
5. 近交衰退(近亲结婚对后代智力造成的不利后果)会影响在某些智力测试题目上的表现。在这些题目上黑人与白人之间智力的差距最大,这也就表示黑人与白人在最易受基因影响的测试部分上的差距最大。
1701565254
1701565255
6. 黑人和白人的智商都与脑容积——大脑的体积——有关,白人的脑容积一般比黑人的大。
1701565256
1701565257
7. 智商更高的人的反应时间更短。在测试中,要求被测试者将手放在一个按钮上,当一个灯泡亮起时,尽可能快地触摸灯泡。白人在这个测试中的反应时间比黑人短。(反应时间短就意味着反应快。)
1701565258
1701565259
8. 由于受到基因的影响,黑人的平均智商天生就比白人低。如果黑人孩子的父母与白人孩子的父母智商相同,那么黑人孩子的平均智商会逐渐降低到白人孩子的平均智商以下。实际情况也确实如此。
1701565260
1701565261
9. 有一项关于种族血统的研究,对黑人孩子、白人孩子和黑人白人混血孩子进行了考察。这些孩子大都被中上阶层的白人家庭收养,黑人孩子的智商与黑人的整体智力水平没有太大区别,而黑人白人混血孩子的智商介于黑人孩子和白人孩子之间(Scarr and Weinberg,1976年和1983年)。
1701565262
1701565263
让我们按照顺序逐一对这些论点进行剖析。
1701565264
1701565265
智力的遗传度
1701565266
1701565267
《钟形曲线》一书中的论点似乎轻松而从容地结束了有关种族和智力的辩论。那些认为黑人与白人基因相同,或至少智力基因相同的人,一定相信黑人与白人没有什么不同,只不过他们所处的认知环境比较恶劣而已。如果实际情况确实如此,我们就需要测量环境对智力的影响,也就是说,我们需要找到两者之间的关联度。
1701565268
1701565269
双胞胎研究给出了智力和环境之间的关联度。赫恩斯坦和莫瑞假设了一个数值,他们认为这个数值代表的是环境对智力的最小影响,即他们假设60%的智力差异都是个体之间的基因差异造成的,剩下的40%是环境因素造成的。为了求得环境与智力之间的关联度,我们需要对环境造成的智力差异的百分比进行开平方运算。0.4的平方根约为0.63,这就是我们要寻找的智力和环境之间的关联度。现在我们就可以计算当黑人与白人的智力差距达到1个标准差时,普通黑人和普通白人所处的环境究竟相差多少。1个标准差除以0.63得到1.59个标准差,这就是这两个种族在环境方面存在的差异。简而言之,只有黑人所处的不利环境如此恶劣,才能够解释黑人与白人在智力上存在的差异!我们来看一下位于正态曲线的平均值下方的一组百分比,这样就能够理解这种环境差距究竟有多大。如果你找到低于平均值1.59个标准差的位置,你就会发现剩下的人口只有6%——这就是说,美国黑人所处的环境非常恶劣,只有6%的美国白人所处的环境在黑人的平均水平之下。
[
上一页 ]
[ :1.70156522e+09 ]
[
下一页 ]