打字猴:1.701778704e+09
1701778704
1701778705 然而,两位学者进一步研究发现,在控制了其他因素的情况下,某个女人的名字听起来像黑人的程度如何和生活质量之间并无关联。“我们发现……在控制了一个女人出生时的相关状况变量后,有一个明显的黑人名字和之后的生活质量之间没有负面关联。”当然,还有大量的变量可以用来公正地检验这个结论,其中有许多是比弗莱尔和莱维特所用的变量更有效的指标。(当有相当大数量的变量被检验时,其中的许多都会与因变量有更强的联系,而且这种联系的强烈程度超过了变量与最根本的相关性之间的联系,结论因此也就不可靠了。)
1701778706
1701778707 弗莱尔和莱维特两人暗示,父母在给孩子起一个听着像是黑人的名字时,并不会担心这在未来可能会对孩子的职业生涯带来什么负面影响。而从实验研究的角度来看,没有负面影响几乎是不可能的。
1701778708
1701778709 凯瑟琳·米尔克曼和她的同事最近所做的一项研究表明,一个听着像是黑人的名字会成为一个人申请入读研究生院的明显障碍。许多教授每周都会收到一封由一个信心十足的学生发来的请求面试、寻求科研机会的邮件。研究表明,如果这个学生的名字听着像是白人,那他得到面试机会的可能性要多12%。这种差异会对研究生入学带来明显的影响。是否能获得研究生院导师的青睐并得到第一次面试机会深深影响着申请人未来的职业生涯。
1701778710
1701778711 为什么弗莱尔和莱维特情愿相信多元回归分析研究比实验研究更有效且准确呢?我猜想这可能源于法国人所谓的“专业误信”(deformation professionelle),即倾向于采用同专业的人都使用的工具和观点。对于经济学家进行的大多数类型的研究而言,多元回归分析都是唯一可用的工具。经济学家们并不能控制美联储设置的利率水平。如果你想了解在“大萧条”时期究竟是紧缩还是刺激性的财政政策能帮助国家经济走出困局,你可以将经济紧缩的程度与经济恢复的程度相联系,然而你无法做到将不同国家随机分配到那种紧缩的境况下。
1701778712
1701778713 经济学家们在专业训练中学到,多元回归分析是研究的主要统计工具。然而,没有人教给他们一种本应当具有的对于多元回归分析的批判性态度。莱维特在与记者史蒂芬·都伯纳合著的一本书中提到一项基于美国教育部数据的分析,即幼儿教育纵向研究。他们测量了一些学生从幼儿园到五年级的学术成就,同时还辅以其他变量,如父母收入和受教育水平、作为研究对象的孩子家中有多少书籍、这些孩子阅读了多少、他们是否是被收养的等。莱维特基于这种多元回归分析得出了一系列变量和学术成就之间的关系。他总结,在剥离了许多变量的(包括家中的藏书量)影响之后,“读书并未影响孩子在幼年时期的考试分数”。多元回归分析并不能简单地告诉我们,读书对孩子的智力发展不重要。只有通过实验才能验证这件事。莱维特还做过一项额外的研究,在剥离了许多变量(包括父母为孩子读书)的影响之后,家中的藏书情况对于考试分数有重要影响。因此,家中藏书多会让孩子更聪明,但是为他们读这些书并没有效果。莱维特对于多元回归分析的执着信念让他坚持尝试在这类事情上找出因果联系。
1701778714
1701778715 莱维特犯得更重要的一个错误是,家庭环境对于孩子的智力发展有相对较小的影响。他得出此结论的研究是基于一些被收养的孩子展开的。“研究表明,一个孩子的学术能力更多地受到其生身父母的智商水平影响,而非养父母。”然而,这种关联是基于错误的数据得出的。我们需要看由自然实验得出的结果,即把被收养的孩子和由亲生父母抚养的孩子进行对比,请注意,亲生父母往往处于低得多的社会经济地位。通常情况下,由养父母创造出的成长环境在很多方面都远强于亲生父母所能给予的环境。实际上,那些被收养的孩子的学业表现得分要比其未被收养的兄弟姐妹高出半个标准差,而前者的智商水平测试得分也要比后者高出一个标准差。养父母所处的社会阶层越高(即平均下来能提供的智力环境更好),被收养的孩子的智商水平测试成绩越好。家庭环境对于智商水平的影响事实上是相当大的。
1701778716
1701778717 在莱维特为自己所做的辩解中,他没有给出自己关于收养环境影响的错误结论。在近几十年中,行为科学家和遗传学家常会用相关性数据做研究,从而得到一些关于环境对于智力水平影响力的错误结论。
1701778718
1701778719 有一些知名经济学家似乎一点儿也没意识到实验的重要价值。经济学家杰弗里·萨克斯在非洲的一部分村落中推广了一个极有野心的项目,涉及健康、农业和教育等方面,旨在提升人们的生活质量。这个项目花费巨大,因此被其他发展专家严厉批评。
1701778720
1701778721 尽管萨克斯项目中的一些村子的居民的生活条件得到了改善,但那些没有得到萨克斯帮助的相似非洲村落似乎改善了更多。如果萨克斯能采取随机实验,便能反驳那些批评,即让相似的村庄分别用他的方法和放任自流,而最终证明他的项目的确效果更好。然而,萨克斯拒绝进行实验,认为其中涉及“道德原因”。当这些项目可行时,对其进行实验是不道德的。萨克斯花费了不少别人的钱,然而我们并不知道那些钱是否有效改善了人们的生活,并且比那些花费较少的项目要好。
1701778722
1701778723 不过,已经有越来越多的经济学家开始采用社会心理学的研究方法,进行随机控制实验。最近的一个例子是由经济学家塞德希尔·穆莱纳森和心理学家埃尔达尔·沙菲尔进行的一系列令人印象深刻的实验,结果表明缺乏资源会给每个人的认知功能带来不良后果,无论是农民还是企业的首席执行官都无法避免。如果你让人们去想象,如果他们突然需要拿出几千美元的预算去修理汽车,然后再让他们进行智商水平测试,你会发现贫穷者的得分大幅下降。同时,那些收入不错的人的得分则不会因为这个思想实验而受影响。(如果是只花费几百美元的修车场景则对贫穷者和富人都没有影响。)
1701778724
1701778725 经济学家拉吉·切迪是推动经济学家们采取自然实验的方式检验经济学假设的领导者。从长远来看,教师素质真的重要吗?我们可以通过实验来探究这个问题,让一位高水平的教师和一位资质较平庸的教师来带某一个班级,看看这个班级学生的平均成绩如何,即两位教师轮流带班(高水平的教师或者资质平庸的教师先带班皆可)之后的成绩变化情况。例如,某一所学校每一届的三年级学生可能都会得到差不多的平均成绩,直到有一位优秀的老师到来之后学生们的成绩就提高了(先前的老师离开可能是因为身体原因)。如果在这位优秀的老师在职期间,学生们的成绩得到了很大提升并维持下去,我们便可以看到学生们相应的学术成就的提升,大学入学率的提高和工作后收入的增长。所有这些由教师的好资质对所有变量带来的影响都是显著的。这样的研究近似于实验,因为我们可以把新教师任职前学生们的表现情况大体上看作控制组。问题在于老师们布置作业的情况不是随机的,但是当老师们能实现布置作业完全是偶然条件时,这就是一个相当完美的自然实验了。
1701778726
1701778727 经济学家进行的一些重要的干预教育过程的实验是由罗兰·弗莱尔设计实施的。他进行了许多极有价值的教育实验,证明了许多猜想,比如经济激励对于少数族裔学生的学术成就的影响特别小。经济激励对教师的表现也影响较小,除非是出于损失厌恶的考虑,即在学年初给教师们经济激励,并告诉他们如果学生的成绩没有提高,那么就将收回这项激励。这个发现也恰好证明了我们在第5章中所讨论的,潜在损失的效果要大于潜在收益。弗莱尔同样也为哈莱姆儿童区实验做出了贡献,参与这个项目的非裔美国孩子在学术成就上获得了较大提升。
1701778728
1701778729 固执的心理学家
1701778730
1701778731 恐怕现在我不得不承认,心理学家也像其他行为科学家一样要对自己误用多元回归分析而感到惭愧。
1701778732
1701778733 我们经常可以看到下面一些所谓的发现。那些可以从公司获得充足产假福利的员工比没有这种福利的员工对工作的满意度更高。这种关联可以由多元回归分析来支持,研究表明更好的休假制度会让员工对其工作更满意,而这种关联甚至在“控制”了公司规模、员工薪酬、同事的满意度、直接上级的受欢迎程度等变量之后,仍然是成立的。然而,这种分析存在三个问题。第一,研究中测量的变量是有限的,如果对其中一个或多个变量的测量不准确,或者存在某个未被测量的变量并且其和休产假制度与员工的满意度都有关联,那么它可能会成为解释休产假制度与员工满意度关联的变量。第二,单独把休产假从员工对于公司的整体体验中剥离出来分析实际上没有任何意义。在这一方面表现得慷慨的公司可能在其他各方面都有积极的表现。从一个公司复杂的系统中抽出一个方面来分析,并“控制”住极为有限的几个相关变量,可能并不能保证我们不犯错误。第三,这种分析很有可能让我们陷入第3章中讨论过的成见效应的陷阱。那些喜欢自己工作的人会发现公司的卫生间更干净,同事们的仪表更好,每天通勤的过程不会枯燥。爱是盲目的,在爱中思考有时候并不是那么有效。
1701778734
1701778735 如果将这些问题放在人格研究中来看,可能会更容易明白。从一个人身上挑出一个性格特点,并假定这一点和他的其他特征联系不大,这是没有什么意义的。心理学家经常会谈诸如此类的发现,比如“在控制了外向性格、自我控制的变量和抑郁倾向等变量后,自尊会和学术表现有关联”。然而,低自尊和其他负面性格特征,比如抑郁,通常都会被发现是有关联的:当你心情低落时,你会看轻自己;当你认为自己不够好时,你的情绪会更低落。将自尊看作一个变量,单独分析它与抑郁的关联,这是武断的。这样的关联并不可信,因为很多人会说,“我简直糟透了,我实在是抑郁,都看不到前路在哪里”,或者说“我再也不会快乐起来了,我真是太愚蠢了”。这些都是可能的,然而这类句子形成的循环结构反映了一个事实,那便是自尊和抑郁往往缠绕在一起。它们是相关的,不可能被割裂开来。
1701778736
1701778737 我的许多心理学家朋友可能要对我坚持的原则感到郁闷了:下面的情况都不能以多元回归分析来解释——在控制了抑郁这个变量后,去看学术成就是否受到自尊的影响;在控制了神经敏感度这个变量后,兄弟会成员的受欢迎程度是否受到外向性格的影响;在控制了年龄、受教育程度、社交活动的频率和其他一些变量之后,一个人每天接受拥抱的次数是否能预测其对传染病的抵抗力。由自然联系起来的那些东西,多元回归分析是不能将其分割的。
1701778738
1701778739 没有相关性不意味着没有因果
1701778740
1701778741 有相关性并不能证明存在因果关系。然而,相关性研究存在的问题比这一点更糟糕。没有相关性不能证明就不存在因果关系——这样的错误和反过来的错误,人们都会经常犯。
1701778742
1701778743 多元化的训练项目是否提升了女性和少数族裔职员的聘任率呢?我们就这一问题对美国700个组织机构的人力资源经理进行访问,询问其组织是否有多元化训练项目,并且查看了美国平等就业机会委员会的相关档案,以确认这些组织的多元化聘任情况。结果是,公司具有多元化训练项目和“在管理层中有白人女性、黑人女性、黑人男性”这一点并无关联。研究者因此认为,多元化训练并不会影响对少数群体的聘任情况。
1701778744
1701778745 但是,且慢。是否有多元化训练项目这件事本身,便是一个自我选择变量。一些公司虽然聘任了推行多元化计划的训练师,但公司本身对于聘任女性和少数族裔的人员就没有太大兴趣,甚至还不如另一些积极寻找其他方式增加聘任多样性的公司。实际上,这些公司可能只是应用这种项目来掩盖其真正的招聘意图。有些没有开展多元化培训的公司反倒可能在聘任女性和少数族裔上成效卓著,它们会利用诸如强制多元化一类的方式来实现,就像美国军队做的那样,成功提升了少数族裔在上级军官那里得到的评级。要证明多元化训练是否有效需要进行随机实验。我们需要警惕一种结论,即A与B之间不相关,因而A不可能是B发生的原因。
1701778746
1701778747 歧视:看统计数据还是在会议室装上窃听器?
1701778748
1701778749 尽管我们在讨论有关歧视的问题,但你不可能通过统计学的方法证明哪个组织或是社会中有歧视现象。你可能经常读到一些新闻,比如女性在特定领域中遇到“玻璃天花板”,一些学校有意限制男生或少数族裔的比例。这些都在暗示我们——不,就是直接控诉,有歧视现象存在。然而数字本身是无法解释整个故事的。我们不知道有多少女性和男性一样,有成为律师事务所合伙人或是公司高管的资质和渴望。我们有充分理由相信女孩和男孩在一些违反学校规定的行为上不会有相同的表现。
1701778750
1701778751 就在不久之前,人们还是经常会把研究生院和教员中女性比例低归咎于歧视。的确,是有歧视存在。我曾和负责招收女性进入研究生院和教师队伍中的人私下里聊过。“还是要这个男人吧;女人们太容易中途放弃学业了。”这种私密的聊天能够证明一些简单的数据(比如招收人员的男女比例)无法证明的事情。
1701778752
1701778753 然而,现如今,研究生院中60%的学生是女性,她们还是法学院、医学院以及人文学科、社会科学和生物科学专业的主要组成部分。在我任教的密歇根大学,有2/3的助理教授为女性(这和男性拿到终身教职的比例是相同的)。
[ 上一页 ]  [ :1.701778704e+09 ]  [ 下一页 ]