打字猴:1.701778654e+09
1701778654
1701778655 在许多情况下,多元回归分析向人们揭示了某种因果关系,而真正的随机控制实验给出了另外的结论。在这种情形下,我们应当相信实验的结果。
1701778656
1701778657 你会认为一个班级中孩子的数量对孩子们的学习成绩有影响吗?看上去似乎是有影响的。然而,有许多备受尊敬的调查学者进行的大量多元回归分析告诉我们,去除学区里的孩子所在家庭的平均收入、学校规模、孩子在智商测验中的表现、城市规模和地理位置这些因素,班级的学生数量与学生的成绩并没有关联。推论是:我们现在知道了并不需要浪费钱缩小班级的规模。
1701778658
1701778659 然而,田纳西州的科学家针对班级规模进行了一次随机实验。通过掷硬币,研究者将幼儿园三个年级的孩子随机分配在小班(13~17人)或大班(22~25人)中。这个研究发现小班中的孩子在标准化考试中的成绩提高了0.22个标准差;而且少数族裔孩子的成绩提升效果比白人孩子更明显。另外还有三个关于缩小班级规模对孩子成绩影响的实验,这些实验的结果几乎都和田纳西州的实验相同。这四个实验并不只是关于班级规模和学生成绩关系的附加实验。它们替代了所有有关班级规模的多元回归分析。这是因为对于这类问题,我们会更信赖实验的结果。
1701778660
1701778661 为什么通过多元回归分析会得出班级规模不重要的结论呢?我也不知道。但是,我们也不必非要知道一个有关班级规模是否重要的强力观点。
1701778662
1701778663 当然,这四个实验也留下了许多悬而未决的问题。我们并不知道对于一个国家的不同地区、城市化程度不同的地域、不同的社会阶层而言,班级的规模是否重要。我们不知道那些产生了不同教学效果的班级究竟发生了什么。这些问题的答案可以通过进一步实验来寻找。而对于每个应用不同于现在已有方式来检验不同人群的实验来说,如果有了积极发现,那么我们会更加确信规模大的班级更有利于学生提升成绩。
1701778664
1701778665 缩小班级规模是否是进行教育投资的最佳着力点则是另一个问题,寻找这个问题的答案需要的成本不低。芬兰并没有特别的小型班级,最终教学水平提高更多地是因为向教师支付了更高的薪酬,并且主要从大学班级最优秀的学生中挑选教师,就像美国现在做的一样。不过,无论在什么情况下,一个国家都不可能只根据一个X因素给Y因素带来了有益影响就制定出一个政策。在政策出台过程中,还是需要完备的成本–收益分析的。
1701778666
1701778667 那些基于多元回归分析或相似分析方法的相关性研究所存在的问题是,它们明显会受到自我选择的错误影响。各类样本——人、班级或农田——有着千百种不同。长期吸烟者并不只是吸烟的时间久,他们还会被各种与吸烟有关的因素影响,比如更大的年龄、更低的社会阶层和肥胖。A班的教室比B班的大,然而可能仍然存在一些研究者无法控制的其他变量。A班可能有一位更好的老师,这是因为校长认为可以管理好大班的老师更优秀。B班的学生可能有更好的学业成绩,即便它比A班的学生多,因为校长认为更多有能力的学生在一起会不易受到外界因素干扰。这样看来,并不能通过简单地增加教室或控制变量来解决问题。
1701778668
1701778669 在那些样本是在实验情境下随机分配的研究中,教室存在的多样性在其他层面上也会存在。然而,重要的是,实验中是由研究者选定具体条件的。这意味着,平均而言,实验教室和控制教室有着同样好的老师,同样有能力和积极主动的学生,同样的资源。这些教室并不是自己“选择”了它们所属的水平,而是研究者选定的。那这两类教室唯一的区别就在于相关变量了,即班级的规模。那么,像这样基于班级规模的实验便不会得出确定性的结论。教师和管理者在此不是双盲的。他们知道每个班级的规模,这可能会影响他们的教学方式,包括他们对工作投入多大的精力。这就是那些涉及自我选择的问题中的缺陷。
1701778670
1701778671 医学乱象
1701778672
1701778673 你是否知道摄入大量橄榄油可以让你中风的概率下降41%?你是否知道如果你患上了白内障并对其进行手术,则在未来15年中你的死亡率会比未进行手术的人低40%?你知道耳聋会导致痴呆吗?你知道怀疑他人会导致痴呆吗?
1701778674
1701778675 如果你对上述说法感到怀疑,那是很自然的。然而,这类所谓的发现不断出现在媒体的报道中。它们通常是基于流行病学研究而得出的结果。(流行病学是针对患病群体类型和病因的研究。)大量的流行病学研究都是依赖多元回归分析而进行的。流行病学家们通过多元回归分析“控制”诸如社会阶层、年龄和病人曾经的健康状况等因素。可是,他们无法避免自我选择带来的问题。有条件采取特定治疗方法的只是一类人,能消费大量特定食品的只是一类人,能摄取特定维生素的也只是一类人。这些人跟没有条件做这些事的人有着诸多不同。
1701778676
1701778677 让我们来看那项声称摄入更多橄榄油能降低中风概率的研究,在此研究中剔除的控制因素包括“社会经济背景、体育运动、身高体重指数、中风的风险因素”。那些“频繁”摄入橄榄油的人比从不食用橄榄油的人中风的概率降低了41%。然而,可能并不是摄入橄榄油本身这件事降低了中风概率,而是某种和消费橄榄油相关的事造成的影响。比如说,种族的原因。意大利裔美国人是消费橄榄油的一大群体,而非洲裔美国人则几乎不会消费橄榄油。意大利裔美国人的预期寿命比黑人要长得多,而黑人则刚好更容易中风。
1701778678
1701778679 在流行病学研究中最大的潜在“捣乱分子”通常是社会阶层。如果不是其他大多数医学方面的原因的话,阶层应该是最明显的造成不同人群中风概率不同的因素了。富人和我们不同。他们有更多的钱。更有钱的人便能消费得起橄榄油,而不是玉米油。更有钱的人会有条件进行更广泛的阅读,与他人交流阅读体会,从而相信橄榄油比其他油类更健康。更有钱的人能享受更好的医疗服务。更有钱的人——那些处于更高社会阶层的人,无论是通过教育水平、个人收入,还是职业声望来衡量都会享有更好的生活。
1701778680
1701778681 在流行病学研究中控制不了社会阶层因素而带来一个后果是无法找到一种特定疾病的病因。假设研究者尝试控制社会阶层变量,那么该如何操作呢?有些人使用的收入指标,有些人用的教育水平,有些人用的职业声望。哪一种最好?还是说你最好把三者结合起来?真实的研究中其实会使用其中一种,或者都用,或者另择其他变量。这样做的结果就是媒体上各种“医学发现”让你感到混乱迷茫。(油脂对你无益。不,油脂有益。红肉好。不,红肉不好。抗组胺剂可以有效减轻一般感冒。不,抗组胺剂没什么用。)产生这些不同的结论就是因为研究者采取了不同的方法去定义社会阶层,或者甚至是根本没有考虑这个因素。
1701778682
1701778683 然而,社会阶层只是大量潜藏于多元回归分析研究中的干扰因素之一。几乎所有在此类研究中与预测变量和结果变量都相关的因素最终都能用来解释那两个变量的关联。
1701778684
1701778685 在市场中,有上千种食品补充剂。多元回归分析研究有时能发现某一种补充剂对另一种有益。媒体继而就向公众传达了相关信息。不幸的是,一般读者通常无法判断究竟是否应该对一个基于多元回归分析的特定研究给予较多关注,或者一个真正的实验是否能够传达应当予以注意的重要信息。信息的传达者,即便是那些专业的保健信息传达者,通常也无法完全理解两种研究方法之间的重要区别。
1701778686
1701778687 有众多事例可以表明多元回归分析研究发现的是一件事,而实验发现的是另一件事。例如,多元回归分析研究表明摄入维生素E补充剂可以降低患上前列腺癌的概率,而科学家们在全美多地进行了一项针对维生素E补充剂的随机实验表明,摄入维生素E补充剂竟然让人们患此癌的概率提升了一点点。
1701778688
1701778689 维生素E不是唯一存疑的补充剂。有大量实验研究表明,摄入复合维生素——这是一半美国人都在做的事——没有明显益处,甚至大量服用某种维生素实际上会给人带来伤害。现在几乎没有什么证据可以证明市面上除了维生素E之外的其他5万多种食品补充剂的作用。我们得到的大多关于特定补充剂的证据都证明它们并没有用,有些还有害。糟糕的是,在补充剂生产者的游说下,国会让那些补充剂得到联邦规章的豁免,这些生产者不必通过实验证明那些补充剂的实际效用。结果便是,每年人们在这些无用甚至会伤人的“万灵药”上浪费数十亿美元。
1701778690
1701778691 在只能用实验解决问题时误用多元回归分析
1701778692
1701778693 一个人待业的时间越久,他再找到工作的难度越大。在本书写作之时,美国短期(14周或者更短)待业的人数只比历史上“大萧条”时期之前的人数稍微少一点。但是,长期待业的人数比那时高200倍。一些雇主是否对长期待业者抱有偏见呢?有些人根本不被考虑,是否仅仅因为他们长期待业呢?多元回归分析并不能告诉我们,在其他条件一致的情况下,雇主们是否会对长期待业者表现出不公正。长期待业者可能有糟糕的就业记录,或者对找工作一事表现得怠惰,又或者对其所做的工作极其挑剔。政客们在“大萧条”时期总会以这些陈词滥调作为说辞,然而你依然不能利用多元回归分析来证明这些解释是否正确。即使控制再多的变量也无法避免自我选择的影响,你无法辨别是否存在聘任偏见。
1701778694
1701778695 唯有实验方能回答此问题。经济学家兰德·加亚德和威廉·狄更斯向600个开放职位投了4800份虚构的申请资料。在申请的其他条件都一样的情况下,那些短期失业的虚拟申请人获得面试的机会比长期失业者多两倍。实际上,这些短期失业者并不比那些长期失业者更符合岗位要求。
1701778696
1701778697 有些问题的确只能借助实验,而一些科学家始终感觉通过多元回归分析才能更好地解答。
1701778698
1701778699 许多实验研究表明,非洲裔的美国人在申请工作时会遇到下述情形,在两个申请人其他条件都相同的情况下,如果申请人的名字听上去像是黑人(比如D’Andre或Lakaisha),则其获得面试机会的可能性比名字不像黑人(比如Donald或Linda)的人低。名字听着像白人的申请人获得的面试机会比名字听着像黑人的人多50%。有一个听着像白人的名字在找工作中获得的好处几乎等于8年的工作经验。德高望重的经济学家罗兰·弗莱尔和史蒂文·莱维特对黑人姓名是否真正导致了更低的经济产出感到怀疑,于是他们利用多元回归分析检验听着像黑人的名字和各种经济产出之间的关系。他们研究的人群是出生于加利福尼亚州的非西班牙裔黑人女性,她们在成年后依然在加州工作生活。因变量不是找工作的成功率,收入或是职业声望,而是评定生活状况的一些间接指标,比如不同区域的女人的平均收入,以及她们是否有私人健康保险。研究者声称他们使用的变量是“衡量她的当前工作质量的最佳指标”。(对于研究者而言的确是最好的,不过这真的是一个对于职业成就所进行的相当粗糙的评定。)
1701778700
1701778701 弗莱尔和莱维特发现,名字听着像黑人的女人在代表职业成功的指标上表现得远不及名字听着像白人的女人,正如我们基于实验所做出的预测。然而,当他们控制了以下变量例如这个女人出生的医院里黑人婴儿的出生率、她出生的镇里黑人婴儿的出生率、她的妈妈是否生于加利福尼亚州、她的妈妈生育她的年龄、爸爸当时的年龄、孕期长度、她是否生于一家镇医院、她出生时的体重、她自己生的小孩数量、她是否是单亲妈妈……两位学者发现名字的类型和职业成就之间的关系消失了。
1701778702
1701778703 两位学者注意到了这种分析存在的问题。他们承认“这种实证研究方法的明显缺陷是如果有关于某个女人的未被观察到的变量与生活质量和她的名字本身都有关联,那么我们的评定将会存在偏差”。的确如此。
[ 上一页 ]  [ :1.701778654e+09 ]  [ 下一页 ]