打字猴:1.701778668e+09
1701778668
1701778669 在那些样本是在实验情境下随机分配的研究中,教室存在的多样性在其他层面上也会存在。然而,重要的是,实验中是由研究者选定具体条件的。这意味着,平均而言,实验教室和控制教室有着同样好的老师,同样有能力和积极主动的学生,同样的资源。这些教室并不是自己“选择”了它们所属的水平,而是研究者选定的。那这两类教室唯一的区别就在于相关变量了,即班级的规模。那么,像这样基于班级规模的实验便不会得出确定性的结论。教师和管理者在此不是双盲的。他们知道每个班级的规模,这可能会影响他们的教学方式,包括他们对工作投入多大的精力。这就是那些涉及自我选择的问题中的缺陷。
1701778670
1701778671 医学乱象
1701778672
1701778673 你是否知道摄入大量橄榄油可以让你中风的概率下降41%?你是否知道如果你患上了白内障并对其进行手术,则在未来15年中你的死亡率会比未进行手术的人低40%?你知道耳聋会导致痴呆吗?你知道怀疑他人会导致痴呆吗?
1701778674
1701778675 如果你对上述说法感到怀疑,那是很自然的。然而,这类所谓的发现不断出现在媒体的报道中。它们通常是基于流行病学研究而得出的结果。(流行病学是针对患病群体类型和病因的研究。)大量的流行病学研究都是依赖多元回归分析而进行的。流行病学家们通过多元回归分析“控制”诸如社会阶层、年龄和病人曾经的健康状况等因素。可是,他们无法避免自我选择带来的问题。有条件采取特定治疗方法的只是一类人,能消费大量特定食品的只是一类人,能摄取特定维生素的也只是一类人。这些人跟没有条件做这些事的人有着诸多不同。
1701778676
1701778677 让我们来看那项声称摄入更多橄榄油能降低中风概率的研究,在此研究中剔除的控制因素包括“社会经济背景、体育运动、身高体重指数、中风的风险因素”。那些“频繁”摄入橄榄油的人比从不食用橄榄油的人中风的概率降低了41%。然而,可能并不是摄入橄榄油本身这件事降低了中风概率,而是某种和消费橄榄油相关的事造成的影响。比如说,种族的原因。意大利裔美国人是消费橄榄油的一大群体,而非洲裔美国人则几乎不会消费橄榄油。意大利裔美国人的预期寿命比黑人要长得多,而黑人则刚好更容易中风。
1701778678
1701778679 在流行病学研究中最大的潜在“捣乱分子”通常是社会阶层。如果不是其他大多数医学方面的原因的话,阶层应该是最明显的造成不同人群中风概率不同的因素了。富人和我们不同。他们有更多的钱。更有钱的人便能消费得起橄榄油,而不是玉米油。更有钱的人会有条件进行更广泛的阅读,与他人交流阅读体会,从而相信橄榄油比其他油类更健康。更有钱的人能享受更好的医疗服务。更有钱的人——那些处于更高社会阶层的人,无论是通过教育水平、个人收入,还是职业声望来衡量都会享有更好的生活。
1701778680
1701778681 在流行病学研究中控制不了社会阶层因素而带来一个后果是无法找到一种特定疾病的病因。假设研究者尝试控制社会阶层变量,那么该如何操作呢?有些人使用的收入指标,有些人用的教育水平,有些人用的职业声望。哪一种最好?还是说你最好把三者结合起来?真实的研究中其实会使用其中一种,或者都用,或者另择其他变量。这样做的结果就是媒体上各种“医学发现”让你感到混乱迷茫。(油脂对你无益。不,油脂有益。红肉好。不,红肉不好。抗组胺剂可以有效减轻一般感冒。不,抗组胺剂没什么用。)产生这些不同的结论就是因为研究者采取了不同的方法去定义社会阶层,或者甚至是根本没有考虑这个因素。
1701778682
1701778683 然而,社会阶层只是大量潜藏于多元回归分析研究中的干扰因素之一。几乎所有在此类研究中与预测变量和结果变量都相关的因素最终都能用来解释那两个变量的关联。
1701778684
1701778685 在市场中,有上千种食品补充剂。多元回归分析研究有时能发现某一种补充剂对另一种有益。媒体继而就向公众传达了相关信息。不幸的是,一般读者通常无法判断究竟是否应该对一个基于多元回归分析的特定研究给予较多关注,或者一个真正的实验是否能够传达应当予以注意的重要信息。信息的传达者,即便是那些专业的保健信息传达者,通常也无法完全理解两种研究方法之间的重要区别。
1701778686
1701778687 有众多事例可以表明多元回归分析研究发现的是一件事,而实验发现的是另一件事。例如,多元回归分析研究表明摄入维生素E补充剂可以降低患上前列腺癌的概率,而科学家们在全美多地进行了一项针对维生素E补充剂的随机实验表明,摄入维生素E补充剂竟然让人们患此癌的概率提升了一点点。
1701778688
1701778689 维生素E不是唯一存疑的补充剂。有大量实验研究表明,摄入复合维生素——这是一半美国人都在做的事——没有明显益处,甚至大量服用某种维生素实际上会给人带来伤害。现在几乎没有什么证据可以证明市面上除了维生素E之外的其他5万多种食品补充剂的作用。我们得到的大多关于特定补充剂的证据都证明它们并没有用,有些还有害。糟糕的是,在补充剂生产者的游说下,国会让那些补充剂得到联邦规章的豁免,这些生产者不必通过实验证明那些补充剂的实际效用。结果便是,每年人们在这些无用甚至会伤人的“万灵药”上浪费数十亿美元。
1701778690
1701778691 在只能用实验解决问题时误用多元回归分析
1701778692
1701778693 一个人待业的时间越久,他再找到工作的难度越大。在本书写作之时,美国短期(14周或者更短)待业的人数只比历史上“大萧条”时期之前的人数稍微少一点。但是,长期待业的人数比那时高200倍。一些雇主是否对长期待业者抱有偏见呢?有些人根本不被考虑,是否仅仅因为他们长期待业呢?多元回归分析并不能告诉我们,在其他条件一致的情况下,雇主们是否会对长期待业者表现出不公正。长期待业者可能有糟糕的就业记录,或者对找工作一事表现得怠惰,又或者对其所做的工作极其挑剔。政客们在“大萧条”时期总会以这些陈词滥调作为说辞,然而你依然不能利用多元回归分析来证明这些解释是否正确。即使控制再多的变量也无法避免自我选择的影响,你无法辨别是否存在聘任偏见。
1701778694
1701778695 唯有实验方能回答此问题。经济学家兰德·加亚德和威廉·狄更斯向600个开放职位投了4800份虚构的申请资料。在申请的其他条件都一样的情况下,那些短期失业的虚拟申请人获得面试的机会比长期失业者多两倍。实际上,这些短期失业者并不比那些长期失业者更符合岗位要求。
1701778696
1701778697 有些问题的确只能借助实验,而一些科学家始终感觉通过多元回归分析才能更好地解答。
1701778698
1701778699 许多实验研究表明,非洲裔的美国人在申请工作时会遇到下述情形,在两个申请人其他条件都相同的情况下,如果申请人的名字听上去像是黑人(比如D’Andre或Lakaisha),则其获得面试机会的可能性比名字不像黑人(比如Donald或Linda)的人低。名字听着像白人的申请人获得的面试机会比名字听着像黑人的人多50%。有一个听着像白人的名字在找工作中获得的好处几乎等于8年的工作经验。德高望重的经济学家罗兰·弗莱尔和史蒂文·莱维特对黑人姓名是否真正导致了更低的经济产出感到怀疑,于是他们利用多元回归分析检验听着像黑人的名字和各种经济产出之间的关系。他们研究的人群是出生于加利福尼亚州的非西班牙裔黑人女性,她们在成年后依然在加州工作生活。因变量不是找工作的成功率,收入或是职业声望,而是评定生活状况的一些间接指标,比如不同区域的女人的平均收入,以及她们是否有私人健康保险。研究者声称他们使用的变量是“衡量她的当前工作质量的最佳指标”。(对于研究者而言的确是最好的,不过这真的是一个对于职业成就所进行的相当粗糙的评定。)
1701778700
1701778701 弗莱尔和莱维特发现,名字听着像黑人的女人在代表职业成功的指标上表现得远不及名字听着像白人的女人,正如我们基于实验所做出的预测。然而,当他们控制了以下变量例如这个女人出生的医院里黑人婴儿的出生率、她出生的镇里黑人婴儿的出生率、她的妈妈是否生于加利福尼亚州、她的妈妈生育她的年龄、爸爸当时的年龄、孕期长度、她是否生于一家镇医院、她出生时的体重、她自己生的小孩数量、她是否是单亲妈妈……两位学者发现名字的类型和职业成就之间的关系消失了。
1701778702
1701778703 两位学者注意到了这种分析存在的问题。他们承认“这种实证研究方法的明显缺陷是如果有关于某个女人的未被观察到的变量与生活质量和她的名字本身都有关联,那么我们的评定将会存在偏差”。的确如此。
1701778704
1701778705 然而,两位学者进一步研究发现,在控制了其他因素的情况下,某个女人的名字听起来像黑人的程度如何和生活质量之间并无关联。“我们发现……在控制了一个女人出生时的相关状况变量后,有一个明显的黑人名字和之后的生活质量之间没有负面关联。”当然,还有大量的变量可以用来公正地检验这个结论,其中有许多是比弗莱尔和莱维特所用的变量更有效的指标。(当有相当大数量的变量被检验时,其中的许多都会与因变量有更强的联系,而且这种联系的强烈程度超过了变量与最根本的相关性之间的联系,结论因此也就不可靠了。)
1701778706
1701778707 弗莱尔和莱维特两人暗示,父母在给孩子起一个听着像是黑人的名字时,并不会担心这在未来可能会对孩子的职业生涯带来什么负面影响。而从实验研究的角度来看,没有负面影响几乎是不可能的。
1701778708
1701778709 凯瑟琳·米尔克曼和她的同事最近所做的一项研究表明,一个听着像是黑人的名字会成为一个人申请入读研究生院的明显障碍。许多教授每周都会收到一封由一个信心十足的学生发来的请求面试、寻求科研机会的邮件。研究表明,如果这个学生的名字听着像是白人,那他得到面试机会的可能性要多12%。这种差异会对研究生入学带来明显的影响。是否能获得研究生院导师的青睐并得到第一次面试机会深深影响着申请人未来的职业生涯。
1701778710
1701778711 为什么弗莱尔和莱维特情愿相信多元回归分析研究比实验研究更有效且准确呢?我猜想这可能源于法国人所谓的“专业误信”(deformation professionelle),即倾向于采用同专业的人都使用的工具和观点。对于经济学家进行的大多数类型的研究而言,多元回归分析都是唯一可用的工具。经济学家们并不能控制美联储设置的利率水平。如果你想了解在“大萧条”时期究竟是紧缩还是刺激性的财政政策能帮助国家经济走出困局,你可以将经济紧缩的程度与经济恢复的程度相联系,然而你无法做到将不同国家随机分配到那种紧缩的境况下。
1701778712
1701778713 经济学家们在专业训练中学到,多元回归分析是研究的主要统计工具。然而,没有人教给他们一种本应当具有的对于多元回归分析的批判性态度。莱维特在与记者史蒂芬·都伯纳合著的一本书中提到一项基于美国教育部数据的分析,即幼儿教育纵向研究。他们测量了一些学生从幼儿园到五年级的学术成就,同时还辅以其他变量,如父母收入和受教育水平、作为研究对象的孩子家中有多少书籍、这些孩子阅读了多少、他们是否是被收养的等。莱维特基于这种多元回归分析得出了一系列变量和学术成就之间的关系。他总结,在剥离了许多变量的(包括家中的藏书量)影响之后,“读书并未影响孩子在幼年时期的考试分数”。多元回归分析并不能简单地告诉我们,读书对孩子的智力发展不重要。只有通过实验才能验证这件事。莱维特还做过一项额外的研究,在剥离了许多变量(包括父母为孩子读书)的影响之后,家中的藏书情况对于考试分数有重要影响。因此,家中藏书多会让孩子更聪明,但是为他们读这些书并没有效果。莱维特对于多元回归分析的执着信念让他坚持尝试在这类事情上找出因果联系。
1701778714
1701778715 莱维特犯得更重要的一个错误是,家庭环境对于孩子的智力发展有相对较小的影响。他得出此结论的研究是基于一些被收养的孩子展开的。“研究表明,一个孩子的学术能力更多地受到其生身父母的智商水平影响,而非养父母。”然而,这种关联是基于错误的数据得出的。我们需要看由自然实验得出的结果,即把被收养的孩子和由亲生父母抚养的孩子进行对比,请注意,亲生父母往往处于低得多的社会经济地位。通常情况下,由养父母创造出的成长环境在很多方面都远强于亲生父母所能给予的环境。实际上,那些被收养的孩子的学业表现得分要比其未被收养的兄弟姐妹高出半个标准差,而前者的智商水平测试得分也要比后者高出一个标准差。养父母所处的社会阶层越高(即平均下来能提供的智力环境更好),被收养的孩子的智商水平测试成绩越好。家庭环境对于智商水平的影响事实上是相当大的。
1701778716
1701778717 在莱维特为自己所做的辩解中,他没有给出自己关于收养环境影响的错误结论。在近几十年中,行为科学家和遗传学家常会用相关性数据做研究,从而得到一些关于环境对于智力水平影响力的错误结论。
[ 上一页 ]  [ :1.701778668e+09 ]  [ 下一页 ]