打字猴:1.701778648e+09
1701778648
1701778649 但是,有时候我们也会看到一种被称作“滞后相关”的因果关系,即一个自变量(假定的原因)与另一个变量(假定的结果)的关系会在一段时间之后体现。例如,如果一个人因为教育水平提高而变得更聪明,那么他在将来的某个时候会更富有吗?的确会更富有。几十年前,爱尔兰在提升其教育体系上获得了综合性的高度成功,尤其是成功提高了高中、职业学校和大学的教学水平。大学入学率在较短时间内就提升了50%。经过30年的发展,那个曾经国民智商测验得分远低于英国的爱尔兰(据英国的一些心理学家称,这是基因导致的)的人均国内生产总值竟然超出了英国。芬兰同样从几十年前开始努力,显著提升了国民的受教育水平。芬兰主要的关注点在于保证那些最贫穷的孩子也能获得和最富有的孩子一样的受教育机会。到2010年,芬兰人在国际学术成就测验中取得的成绩超过其他任何国家的人,其个人平均收入取得了极大增长,一举超过日本和英国,紧随美国居次。那些在近些年中没有在教育提升方面取得长足进展的国家则在国民人均收入上有所跌落,比如美国。这样的数据之间仍存在相关性,而它们表明当一个国家开始打破其教育方面的困局时,它就会变得更富裕。当一个国家在教育方面停滞不前时,与其他保持进步的国家相比,它会失去其财富。这一点相当有说服力。
1701778650
1701778651 许多其他情境也可以极大地提升相关性研究的说服力,使其几乎可以与自然实验,甚至是与随机控制实验的说服力相比肩。例如,纯粹对于效果的度量有时候会让我们感到这肯定不仅仅是人为控制的,而是存在相关变量。我们有时候也会对一种情况表现出确信无疑的态度,即如果效果是有“剂量依赖性”的,那么产生这种效果的特定治疗方法便是真实的。换句话说,使用某种治疗方法的频率越高,则效果显示得越明显。比如,那些一天抽两包烟的人比一天吸一包烟的人更有可能在心血管方面出现问题。这更容易让人们相信,吸烟真的会让心血管的健康状况恶化,而其实单纯的吸烟数量与发病率并无关联。
1701778652
1701778653 然而,因为多元回归分析常被采用,所以关于它确实存在一些严重的问题。我必须要明确指出这些问题,因为媒体总在持续报道基于错误方法而得出的研究结论,而一些重要的政府决策就是基于这些报道而来。流行病学家、疾病研究者、社会学家、心理学家和经济学家都会用到多元回归的工具。它会引发严重的错误,而这种方法的拥护者宣告他们发现了所谓的因果关系其实是虚假的。
1701778654
1701778655 在许多情况下,多元回归分析向人们揭示了某种因果关系,而真正的随机控制实验给出了另外的结论。在这种情形下,我们应当相信实验的结果。
1701778656
1701778657 你会认为一个班级中孩子的数量对孩子们的学习成绩有影响吗?看上去似乎是有影响的。然而,有许多备受尊敬的调查学者进行的大量多元回归分析告诉我们,去除学区里的孩子所在家庭的平均收入、学校规模、孩子在智商测验中的表现、城市规模和地理位置这些因素,班级的学生数量与学生的成绩并没有关联。推论是:我们现在知道了并不需要浪费钱缩小班级的规模。
1701778658
1701778659 然而,田纳西州的科学家针对班级规模进行了一次随机实验。通过掷硬币,研究者将幼儿园三个年级的孩子随机分配在小班(13~17人)或大班(22~25人)中。这个研究发现小班中的孩子在标准化考试中的成绩提高了0.22个标准差;而且少数族裔孩子的成绩提升效果比白人孩子更明显。另外还有三个关于缩小班级规模对孩子成绩影响的实验,这些实验的结果几乎都和田纳西州的实验相同。这四个实验并不只是关于班级规模和学生成绩关系的附加实验。它们替代了所有有关班级规模的多元回归分析。这是因为对于这类问题,我们会更信赖实验的结果。
1701778660
1701778661 为什么通过多元回归分析会得出班级规模不重要的结论呢?我也不知道。但是,我们也不必非要知道一个有关班级规模是否重要的强力观点。
1701778662
1701778663 当然,这四个实验也留下了许多悬而未决的问题。我们并不知道对于一个国家的不同地区、城市化程度不同的地域、不同的社会阶层而言,班级的规模是否重要。我们不知道那些产生了不同教学效果的班级究竟发生了什么。这些问题的答案可以通过进一步实验来寻找。而对于每个应用不同于现在已有方式来检验不同人群的实验来说,如果有了积极发现,那么我们会更加确信规模大的班级更有利于学生提升成绩。
1701778664
1701778665 缩小班级规模是否是进行教育投资的最佳着力点则是另一个问题,寻找这个问题的答案需要的成本不低。芬兰并没有特别的小型班级,最终教学水平提高更多地是因为向教师支付了更高的薪酬,并且主要从大学班级最优秀的学生中挑选教师,就像美国现在做的一样。不过,无论在什么情况下,一个国家都不可能只根据一个X因素给Y因素带来了有益影响就制定出一个政策。在政策出台过程中,还是需要完备的成本–收益分析的。
1701778666
1701778667 那些基于多元回归分析或相似分析方法的相关性研究所存在的问题是,它们明显会受到自我选择的错误影响。各类样本——人、班级或农田——有着千百种不同。长期吸烟者并不只是吸烟的时间久,他们还会被各种与吸烟有关的因素影响,比如更大的年龄、更低的社会阶层和肥胖。A班的教室比B班的大,然而可能仍然存在一些研究者无法控制的其他变量。A班可能有一位更好的老师,这是因为校长认为可以管理好大班的老师更优秀。B班的学生可能有更好的学业成绩,即便它比A班的学生多,因为校长认为更多有能力的学生在一起会不易受到外界因素干扰。这样看来,并不能通过简单地增加教室或控制变量来解决问题。
1701778668
1701778669 在那些样本是在实验情境下随机分配的研究中,教室存在的多样性在其他层面上也会存在。然而,重要的是,实验中是由研究者选定具体条件的。这意味着,平均而言,实验教室和控制教室有着同样好的老师,同样有能力和积极主动的学生,同样的资源。这些教室并不是自己“选择”了它们所属的水平,而是研究者选定的。那这两类教室唯一的区别就在于相关变量了,即班级的规模。那么,像这样基于班级规模的实验便不会得出确定性的结论。教师和管理者在此不是双盲的。他们知道每个班级的规模,这可能会影响他们的教学方式,包括他们对工作投入多大的精力。这就是那些涉及自我选择的问题中的缺陷。
1701778670
1701778671 医学乱象
1701778672
1701778673 你是否知道摄入大量橄榄油可以让你中风的概率下降41%?你是否知道如果你患上了白内障并对其进行手术,则在未来15年中你的死亡率会比未进行手术的人低40%?你知道耳聋会导致痴呆吗?你知道怀疑他人会导致痴呆吗?
1701778674
1701778675 如果你对上述说法感到怀疑,那是很自然的。然而,这类所谓的发现不断出现在媒体的报道中。它们通常是基于流行病学研究而得出的结果。(流行病学是针对患病群体类型和病因的研究。)大量的流行病学研究都是依赖多元回归分析而进行的。流行病学家们通过多元回归分析“控制”诸如社会阶层、年龄和病人曾经的健康状况等因素。可是,他们无法避免自我选择带来的问题。有条件采取特定治疗方法的只是一类人,能消费大量特定食品的只是一类人,能摄取特定维生素的也只是一类人。这些人跟没有条件做这些事的人有着诸多不同。
1701778676
1701778677 让我们来看那项声称摄入更多橄榄油能降低中风概率的研究,在此研究中剔除的控制因素包括“社会经济背景、体育运动、身高体重指数、中风的风险因素”。那些“频繁”摄入橄榄油的人比从不食用橄榄油的人中风的概率降低了41%。然而,可能并不是摄入橄榄油本身这件事降低了中风概率,而是某种和消费橄榄油相关的事造成的影响。比如说,种族的原因。意大利裔美国人是消费橄榄油的一大群体,而非洲裔美国人则几乎不会消费橄榄油。意大利裔美国人的预期寿命比黑人要长得多,而黑人则刚好更容易中风。
1701778678
1701778679 在流行病学研究中最大的潜在“捣乱分子”通常是社会阶层。如果不是其他大多数医学方面的原因的话,阶层应该是最明显的造成不同人群中风概率不同的因素了。富人和我们不同。他们有更多的钱。更有钱的人便能消费得起橄榄油,而不是玉米油。更有钱的人会有条件进行更广泛的阅读,与他人交流阅读体会,从而相信橄榄油比其他油类更健康。更有钱的人能享受更好的医疗服务。更有钱的人——那些处于更高社会阶层的人,无论是通过教育水平、个人收入,还是职业声望来衡量都会享有更好的生活。
1701778680
1701778681 在流行病学研究中控制不了社会阶层因素而带来一个后果是无法找到一种特定疾病的病因。假设研究者尝试控制社会阶层变量,那么该如何操作呢?有些人使用的收入指标,有些人用的教育水平,有些人用的职业声望。哪一种最好?还是说你最好把三者结合起来?真实的研究中其实会使用其中一种,或者都用,或者另择其他变量。这样做的结果就是媒体上各种“医学发现”让你感到混乱迷茫。(油脂对你无益。不,油脂有益。红肉好。不,红肉不好。抗组胺剂可以有效减轻一般感冒。不,抗组胺剂没什么用。)产生这些不同的结论就是因为研究者采取了不同的方法去定义社会阶层,或者甚至是根本没有考虑这个因素。
1701778682
1701778683 然而,社会阶层只是大量潜藏于多元回归分析研究中的干扰因素之一。几乎所有在此类研究中与预测变量和结果变量都相关的因素最终都能用来解释那两个变量的关联。
1701778684
1701778685 在市场中,有上千种食品补充剂。多元回归分析研究有时能发现某一种补充剂对另一种有益。媒体继而就向公众传达了相关信息。不幸的是,一般读者通常无法判断究竟是否应该对一个基于多元回归分析的特定研究给予较多关注,或者一个真正的实验是否能够传达应当予以注意的重要信息。信息的传达者,即便是那些专业的保健信息传达者,通常也无法完全理解两种研究方法之间的重要区别。
1701778686
1701778687 有众多事例可以表明多元回归分析研究发现的是一件事,而实验发现的是另一件事。例如,多元回归分析研究表明摄入维生素E补充剂可以降低患上前列腺癌的概率,而科学家们在全美多地进行了一项针对维生素E补充剂的随机实验表明,摄入维生素E补充剂竟然让人们患此癌的概率提升了一点点。
1701778688
1701778689 维生素E不是唯一存疑的补充剂。有大量实验研究表明,摄入复合维生素——这是一半美国人都在做的事——没有明显益处,甚至大量服用某种维生素实际上会给人带来伤害。现在几乎没有什么证据可以证明市面上除了维生素E之外的其他5万多种食品补充剂的作用。我们得到的大多关于特定补充剂的证据都证明它们并没有用,有些还有害。糟糕的是,在补充剂生产者的游说下,国会让那些补充剂得到联邦规章的豁免,这些生产者不必通过实验证明那些补充剂的实际效用。结果便是,每年人们在这些无用甚至会伤人的“万灵药”上浪费数十亿美元。
1701778690
1701778691 在只能用实验解决问题时误用多元回归分析
1701778692
1701778693 一个人待业的时间越久,他再找到工作的难度越大。在本书写作之时,美国短期(14周或者更短)待业的人数只比历史上“大萧条”时期之前的人数稍微少一点。但是,长期待业的人数比那时高200倍。一些雇主是否对长期待业者抱有偏见呢?有些人根本不被考虑,是否仅仅因为他们长期待业呢?多元回归分析并不能告诉我们,在其他条件一致的情况下,雇主们是否会对长期待业者表现出不公正。长期待业者可能有糟糕的就业记录,或者对找工作一事表现得怠惰,又或者对其所做的工作极其挑剔。政客们在“大萧条”时期总会以这些陈词滥调作为说辞,然而你依然不能利用多元回归分析来证明这些解释是否正确。即使控制再多的变量也无法避免自我选择的影响,你无法辨别是否存在聘任偏见。
1701778694
1701778695 唯有实验方能回答此问题。经济学家兰德·加亚德和威廉·狄更斯向600个开放职位投了4800份虚构的申请资料。在申请的其他条件都一样的情况下,那些短期失业的虚拟申请人获得面试的机会比长期失业者多两倍。实际上,这些短期失业者并不比那些长期失业者更符合岗位要求。
1701778696
1701778697 有些问题的确只能借助实验,而一些科学家始终感觉通过多元回归分析才能更好地解答。
[ 上一页 ]  [ :1.701778648e+09 ]  [ 下一页 ]