打字猴:1.701778684e+09
1701778684
1701778685 在市场中,有上千种食品补充剂。多元回归分析研究有时能发现某一种补充剂对另一种有益。媒体继而就向公众传达了相关信息。不幸的是,一般读者通常无法判断究竟是否应该对一个基于多元回归分析的特定研究给予较多关注,或者一个真正的实验是否能够传达应当予以注意的重要信息。信息的传达者,即便是那些专业的保健信息传达者,通常也无法完全理解两种研究方法之间的重要区别。
1701778686
1701778687 有众多事例可以表明多元回归分析研究发现的是一件事,而实验发现的是另一件事。例如,多元回归分析研究表明摄入维生素E补充剂可以降低患上前列腺癌的概率,而科学家们在全美多地进行了一项针对维生素E补充剂的随机实验表明,摄入维生素E补充剂竟然让人们患此癌的概率提升了一点点。
1701778688
1701778689 维生素E不是唯一存疑的补充剂。有大量实验研究表明,摄入复合维生素——这是一半美国人都在做的事——没有明显益处,甚至大量服用某种维生素实际上会给人带来伤害。现在几乎没有什么证据可以证明市面上除了维生素E之外的其他5万多种食品补充剂的作用。我们得到的大多关于特定补充剂的证据都证明它们并没有用,有些还有害。糟糕的是,在补充剂生产者的游说下,国会让那些补充剂得到联邦规章的豁免,这些生产者不必通过实验证明那些补充剂的实际效用。结果便是,每年人们在这些无用甚至会伤人的“万灵药”上浪费数十亿美元。
1701778690
1701778691 在只能用实验解决问题时误用多元回归分析
1701778692
1701778693 一个人待业的时间越久,他再找到工作的难度越大。在本书写作之时,美国短期(14周或者更短)待业的人数只比历史上“大萧条”时期之前的人数稍微少一点。但是,长期待业的人数比那时高200倍。一些雇主是否对长期待业者抱有偏见呢?有些人根本不被考虑,是否仅仅因为他们长期待业呢?多元回归分析并不能告诉我们,在其他条件一致的情况下,雇主们是否会对长期待业者表现出不公正。长期待业者可能有糟糕的就业记录,或者对找工作一事表现得怠惰,又或者对其所做的工作极其挑剔。政客们在“大萧条”时期总会以这些陈词滥调作为说辞,然而你依然不能利用多元回归分析来证明这些解释是否正确。即使控制再多的变量也无法避免自我选择的影响,你无法辨别是否存在聘任偏见。
1701778694
1701778695 唯有实验方能回答此问题。经济学家兰德·加亚德和威廉·狄更斯向600个开放职位投了4800份虚构的申请资料。在申请的其他条件都一样的情况下,那些短期失业的虚拟申请人获得面试的机会比长期失业者多两倍。实际上,这些短期失业者并不比那些长期失业者更符合岗位要求。
1701778696
1701778697 有些问题的确只能借助实验,而一些科学家始终感觉通过多元回归分析才能更好地解答。
1701778698
1701778699 许多实验研究表明,非洲裔的美国人在申请工作时会遇到下述情形,在两个申请人其他条件都相同的情况下,如果申请人的名字听上去像是黑人(比如D’Andre或Lakaisha),则其获得面试机会的可能性比名字不像黑人(比如Donald或Linda)的人低。名字听着像白人的申请人获得的面试机会比名字听着像黑人的人多50%。有一个听着像白人的名字在找工作中获得的好处几乎等于8年的工作经验。德高望重的经济学家罗兰·弗莱尔和史蒂文·莱维特对黑人姓名是否真正导致了更低的经济产出感到怀疑,于是他们利用多元回归分析检验听着像黑人的名字和各种经济产出之间的关系。他们研究的人群是出生于加利福尼亚州的非西班牙裔黑人女性,她们在成年后依然在加州工作生活。因变量不是找工作的成功率,收入或是职业声望,而是评定生活状况的一些间接指标,比如不同区域的女人的平均收入,以及她们是否有私人健康保险。研究者声称他们使用的变量是“衡量她的当前工作质量的最佳指标”。(对于研究者而言的确是最好的,不过这真的是一个对于职业成就所进行的相当粗糙的评定。)
1701778700
1701778701 弗莱尔和莱维特发现,名字听着像黑人的女人在代表职业成功的指标上表现得远不及名字听着像白人的女人,正如我们基于实验所做出的预测。然而,当他们控制了以下变量例如这个女人出生的医院里黑人婴儿的出生率、她出生的镇里黑人婴儿的出生率、她的妈妈是否生于加利福尼亚州、她的妈妈生育她的年龄、爸爸当时的年龄、孕期长度、她是否生于一家镇医院、她出生时的体重、她自己生的小孩数量、她是否是单亲妈妈……两位学者发现名字的类型和职业成就之间的关系消失了。
1701778702
1701778703 两位学者注意到了这种分析存在的问题。他们承认“这种实证研究方法的明显缺陷是如果有关于某个女人的未被观察到的变量与生活质量和她的名字本身都有关联,那么我们的评定将会存在偏差”。的确如此。
1701778704
1701778705 然而,两位学者进一步研究发现,在控制了其他因素的情况下,某个女人的名字听起来像黑人的程度如何和生活质量之间并无关联。“我们发现……在控制了一个女人出生时的相关状况变量后,有一个明显的黑人名字和之后的生活质量之间没有负面关联。”当然,还有大量的变量可以用来公正地检验这个结论,其中有许多是比弗莱尔和莱维特所用的变量更有效的指标。(当有相当大数量的变量被检验时,其中的许多都会与因变量有更强的联系,而且这种联系的强烈程度超过了变量与最根本的相关性之间的联系,结论因此也就不可靠了。)
1701778706
1701778707 弗莱尔和莱维特两人暗示,父母在给孩子起一个听着像是黑人的名字时,并不会担心这在未来可能会对孩子的职业生涯带来什么负面影响。而从实验研究的角度来看,没有负面影响几乎是不可能的。
1701778708
1701778709 凯瑟琳·米尔克曼和她的同事最近所做的一项研究表明,一个听着像是黑人的名字会成为一个人申请入读研究生院的明显障碍。许多教授每周都会收到一封由一个信心十足的学生发来的请求面试、寻求科研机会的邮件。研究表明,如果这个学生的名字听着像是白人,那他得到面试机会的可能性要多12%。这种差异会对研究生入学带来明显的影响。是否能获得研究生院导师的青睐并得到第一次面试机会深深影响着申请人未来的职业生涯。
1701778710
1701778711 为什么弗莱尔和莱维特情愿相信多元回归分析研究比实验研究更有效且准确呢?我猜想这可能源于法国人所谓的“专业误信”(deformation professionelle),即倾向于采用同专业的人都使用的工具和观点。对于经济学家进行的大多数类型的研究而言,多元回归分析都是唯一可用的工具。经济学家们并不能控制美联储设置的利率水平。如果你想了解在“大萧条”时期究竟是紧缩还是刺激性的财政政策能帮助国家经济走出困局,你可以将经济紧缩的程度与经济恢复的程度相联系,然而你无法做到将不同国家随机分配到那种紧缩的境况下。
1701778712
1701778713 经济学家们在专业训练中学到,多元回归分析是研究的主要统计工具。然而,没有人教给他们一种本应当具有的对于多元回归分析的批判性态度。莱维特在与记者史蒂芬·都伯纳合著的一本书中提到一项基于美国教育部数据的分析,即幼儿教育纵向研究。他们测量了一些学生从幼儿园到五年级的学术成就,同时还辅以其他变量,如父母收入和受教育水平、作为研究对象的孩子家中有多少书籍、这些孩子阅读了多少、他们是否是被收养的等。莱维特基于这种多元回归分析得出了一系列变量和学术成就之间的关系。他总结,在剥离了许多变量的(包括家中的藏书量)影响之后,“读书并未影响孩子在幼年时期的考试分数”。多元回归分析并不能简单地告诉我们,读书对孩子的智力发展不重要。只有通过实验才能验证这件事。莱维特还做过一项额外的研究,在剥离了许多变量(包括父母为孩子读书)的影响之后,家中的藏书情况对于考试分数有重要影响。因此,家中藏书多会让孩子更聪明,但是为他们读这些书并没有效果。莱维特对于多元回归分析的执着信念让他坚持尝试在这类事情上找出因果联系。
1701778714
1701778715 莱维特犯得更重要的一个错误是,家庭环境对于孩子的智力发展有相对较小的影响。他得出此结论的研究是基于一些被收养的孩子展开的。“研究表明,一个孩子的学术能力更多地受到其生身父母的智商水平影响,而非养父母。”然而,这种关联是基于错误的数据得出的。我们需要看由自然实验得出的结果,即把被收养的孩子和由亲生父母抚养的孩子进行对比,请注意,亲生父母往往处于低得多的社会经济地位。通常情况下,由养父母创造出的成长环境在很多方面都远强于亲生父母所能给予的环境。实际上,那些被收养的孩子的学业表现得分要比其未被收养的兄弟姐妹高出半个标准差,而前者的智商水平测试得分也要比后者高出一个标准差。养父母所处的社会阶层越高(即平均下来能提供的智力环境更好),被收养的孩子的智商水平测试成绩越好。家庭环境对于智商水平的影响事实上是相当大的。
1701778716
1701778717 在莱维特为自己所做的辩解中,他没有给出自己关于收养环境影响的错误结论。在近几十年中,行为科学家和遗传学家常会用相关性数据做研究,从而得到一些关于环境对于智力水平影响力的错误结论。
1701778718
1701778719 有一些知名经济学家似乎一点儿也没意识到实验的重要价值。经济学家杰弗里·萨克斯在非洲的一部分村落中推广了一个极有野心的项目,涉及健康、农业和教育等方面,旨在提升人们的生活质量。这个项目花费巨大,因此被其他发展专家严厉批评。
1701778720
1701778721 尽管萨克斯项目中的一些村子的居民的生活条件得到了改善,但那些没有得到萨克斯帮助的相似非洲村落似乎改善了更多。如果萨克斯能采取随机实验,便能反驳那些批评,即让相似的村庄分别用他的方法和放任自流,而最终证明他的项目的确效果更好。然而,萨克斯拒绝进行实验,认为其中涉及“道德原因”。当这些项目可行时,对其进行实验是不道德的。萨克斯花费了不少别人的钱,然而我们并不知道那些钱是否有效改善了人们的生活,并且比那些花费较少的项目要好。
1701778722
1701778723 不过,已经有越来越多的经济学家开始采用社会心理学的研究方法,进行随机控制实验。最近的一个例子是由经济学家塞德希尔·穆莱纳森和心理学家埃尔达尔·沙菲尔进行的一系列令人印象深刻的实验,结果表明缺乏资源会给每个人的认知功能带来不良后果,无论是农民还是企业的首席执行官都无法避免。如果你让人们去想象,如果他们突然需要拿出几千美元的预算去修理汽车,然后再让他们进行智商水平测试,你会发现贫穷者的得分大幅下降。同时,那些收入不错的人的得分则不会因为这个思想实验而受影响。(如果是只花费几百美元的修车场景则对贫穷者和富人都没有影响。)
1701778724
1701778725 经济学家拉吉·切迪是推动经济学家们采取自然实验的方式检验经济学假设的领导者。从长远来看,教师素质真的重要吗?我们可以通过实验来探究这个问题,让一位高水平的教师和一位资质较平庸的教师来带某一个班级,看看这个班级学生的平均成绩如何,即两位教师轮流带班(高水平的教师或者资质平庸的教师先带班皆可)之后的成绩变化情况。例如,某一所学校每一届的三年级学生可能都会得到差不多的平均成绩,直到有一位优秀的老师到来之后学生们的成绩就提高了(先前的老师离开可能是因为身体原因)。如果在这位优秀的老师在职期间,学生们的成绩得到了很大提升并维持下去,我们便可以看到学生们相应的学术成就的提升,大学入学率的提高和工作后收入的增长。所有这些由教师的好资质对所有变量带来的影响都是显著的。这样的研究近似于实验,因为我们可以把新教师任职前学生们的表现情况大体上看作控制组。问题在于老师们布置作业的情况不是随机的,但是当老师们能实现布置作业完全是偶然条件时,这就是一个相当完美的自然实验了。
1701778726
1701778727 经济学家进行的一些重要的干预教育过程的实验是由罗兰·弗莱尔设计实施的。他进行了许多极有价值的教育实验,证明了许多猜想,比如经济激励对于少数族裔学生的学术成就的影响特别小。经济激励对教师的表现也影响较小,除非是出于损失厌恶的考虑,即在学年初给教师们经济激励,并告诉他们如果学生的成绩没有提高,那么就将收回这项激励。这个发现也恰好证明了我们在第5章中所讨论的,潜在损失的效果要大于潜在收益。弗莱尔同样也为哈莱姆儿童区实验做出了贡献,参与这个项目的非裔美国孩子在学术成就上获得了较大提升。
1701778728
1701778729 固执的心理学家
1701778730
1701778731 恐怕现在我不得不承认,心理学家也像其他行为科学家一样要对自己误用多元回归分析而感到惭愧。
1701778732
1701778733 我们经常可以看到下面一些所谓的发现。那些可以从公司获得充足产假福利的员工比没有这种福利的员工对工作的满意度更高。这种关联可以由多元回归分析来支持,研究表明更好的休假制度会让员工对其工作更满意,而这种关联甚至在“控制”了公司规模、员工薪酬、同事的满意度、直接上级的受欢迎程度等变量之后,仍然是成立的。然而,这种分析存在三个问题。第一,研究中测量的变量是有限的,如果对其中一个或多个变量的测量不准确,或者存在某个未被测量的变量并且其和休产假制度与员工的满意度都有关联,那么它可能会成为解释休产假制度与员工满意度关联的变量。第二,单独把休产假从员工对于公司的整体体验中剥离出来分析实际上没有任何意义。在这一方面表现得慷慨的公司可能在其他各方面都有积极的表现。从一个公司复杂的系统中抽出一个方面来分析,并“控制”住极为有限的几个相关变量,可能并不能保证我们不犯错误。第三,这种分析很有可能让我们陷入第3章中讨论过的成见效应的陷阱。那些喜欢自己工作的人会发现公司的卫生间更干净,同事们的仪表更好,每天通勤的过程不会枯燥。爱是盲目的,在爱中思考有时候并不是那么有效。
[ 上一页 ]  [ :1.701778684e+09 ]  [ 下一页 ]