打字猴:1.70264445e+09
1702644450 至今,STAR项目依然是测试小班教学效果唯一的随机实验,其结论无论是在统计学意义还是社会意义方面都是非凡的。总体上看,小班学生在统考中的表现要比常规班级学生高出0.15个标准差,小班里黑人学生的进步更是达到了两倍之多。但坏消息是,STAR项目实验共花费约1200万美元,有关祈祷对术后恢复的效果的研究也花掉了240万美元,最精致的研究与其他任何精致的事物一样,都有一个共同点,那就是价格不菲。
1702644451
1702644452 自然实验。并不是所有人都有能力随随便便投资几百万美元来运行一个大型随机实验。一个更为经济的替代方案是寻找到一个自然实验,当某个事件自然而然地发生时,恰好营造出一个接近于随机、对照的实验环境。本章一开始举的那个有关华盛顿特区警察的案例就是一个自然实验。生活有时候出于偶然而创造了一个实验组和一个对照组,在这个时候,研究人员应该主动出击,对眼前的现象进行分析并得出结论。如果要大家将教育和寿命放在一起联想,那么我们会对这一对看似不相关实则纵横交错的变量作何评价?受教育程度高的人往往活得更久,这个结论在控制了其他如收入、能享受到的医疗资源等因素后依然存在。《纽约时报》报道:“无论是哪个国家的研究人员,一个他们达成共识的与长寿相关的社会因素就是教育。一个人受教育程度的高低与寿命长短的相关性比种族和收入因素都要显着。”但至少到目前为止,这还只是一个相关关系。在其他情况都相同的前提下,更多的教育是否就能够带来更健康的身体?如果你把教育看作一种“治疗”,那么接受更多的“治疗(教育)”是否就能保证你活得更久?
1702644453
1702644454 这是一个看似不可能得到回答的问题,因为选择接受教育的人与不希望读更多书的人肯定在某些方面是不一样的。高中学历与本科学历的人之间的差别绝不仅限于大学4年的教育,在那些选择继续求学的人当中,极有可能存在某些他们所共有的除了教育以外的隐藏特性,从而使得这些人更加长寿。假如这是真的,那么让那些原本没想过继续念书的人上大学;对延长他们的寿命并不会有帮助。健康状况的改善不能归功于提高的教育程度,而是来自于那类选择提高自身教育程度的人所共有的特质。
1702644455
1702644456 我们不能用随机实验来解决这一难题,因为这会让某些实验对象在不情愿的状态下过早地离开校园(如果跟一个人说:你不能去上大学,因为你在对照组。想想就觉得残忍)。测试教育对寿命的因果作用的唯一可行的办法就是,借助某些让不想深造的人继续留在学校的自然实验得出结论,至少这在道德上是可以被接受的,因为我们预测会看到一个积极正面的治疗效果。但是,我们还是不能强迫别人留在学校,这太不符合美国的“自由”精神了。
1702644457
1702644458 可理想往往照不进现实。美国的每一个州都制定了相关法律来保证最低受教育年限,但在历史上,这些法律都曾发生过变化。像这类非研究对象本人所能决定的影响受教育程度的外部变化正是研究人员梦寐以求的。哥伦比亚大学研究生奥德丽安娜•莱拉斯·姆耐发现,美国不同的州在不同时期对各自的最低受教育年限进行过调整,并由此认为这是一个具有研究潜力的课题。她通过翻阅大量史料和人口普查数据,对这些州的义务教育法律中有关最低受教育年限的条款变化以及相对应的居民寿命变化进行了记录。但她依然面临着一个实验方法上的挑战:即使某一个州的居民在最低受教育年限提升之后活得更久,我们也不能将寿命的延长归功于学校教育的增加。这是因为人的平均寿命从总体上看一直在增加,无论对州法律进行何种调整,生于20世纪90年代的人就是活得比生于19世纪50年代的人久。
1702644459
1702644460 但莱拉斯·姆耐还有一个天然的对照组:那些没有对最低受教育年限进行调整的州。她的研究接近于一个大型的实验室实验:按照法律,伊利诺伊州的居民不得不在学校接受7年的教育,而他们的邻居——印第安纳州的居民只需要完成6年的学业就可以选择离开学校了。它与实验室实验唯一的区别就在于,对照组的形成完全是因为一个历史巧合,而这恰恰是“自然实验”的应有之义。
1702644461
1702644462 那结果是什么呢?伊利诺伊州年龄在35周岁及以上的成年人,就因为比印第安纳州的同龄人多上了一年学,他们的预期寿命要比后者多出一年半。莱拉斯-姆耐的研究结论在其他国家的研究中也得到了证实,义务教育年限的差异导致了类似的自然实验。随之而来的就是一些质疑,我们至今也没搞明白多上学可以活得更久背后的原理到底是什么。
1702644463
1702644464 非对等对照实验。有些时候研究治疗效果最佳且可行的方式,并非完全随机地分配实验组和对照组。当环境不允许我们进行随机分配的时候,我们当然希望最终的实验组和对照组能够大体相似,不对结论的准确性产生影响。好消息是,我们有一个实验组,一个对照组。坏消息是,任何非随机分配都会产生偏见,至少是有存在偏见的可能性。就算你认为你的分组毫无破绽,但或许在实验组和对照组之间还有一些难以察觉的差异,正是这些差异影响了小组成员的分配和组成,从而产生跟现实有偏差的结论,这就是我们所说的“非对等对照”。
1702644465
1702644466 一个非对等对照组依然可以成为非常有用的工具。让我们回过头来思考一下本章开头提出的那个问题:进入一所顶尖大学学习真的会给人的一生带来巨大的优势吗?哈佛、普林斯顿、达特茅斯等名牌大学毕业的学生确实非常出色,他们的工资更高,生活也更加精致和丰富多彩,相比之下那些毕业于一般院校的学生就过得惨淡多了。(PayScale网站于2008年曾进行过一项调查,发现工作10~20年的达特茅斯大学毕业生的工资中位数为13.4万美元,是所有本科院校中最高的;普林斯顿大学位居第二,工资中位数为13.1万美元)。我希望大家在这个时候应该能意识到,这些令人脸红心跳的数字其实跟达特茅斯或普林斯顿大学的教育价值毫无关系。进入达特茅斯和普林斯顿大学的学生在高中毕业申请学校时就已经非常出色了,这也是他们能够被这些大学录取的原因。无论他们是否接受过大学教育,都有可能成为生活中的赢家。
1702644467
1702644468 我们所不知道的是,接受像哈佛或耶鲁大学这类顶尖大学的精英教育会产生怎样的效果?从这些名牌大学毕业出来的人之所以能够成功,到底是因为他们当初在跨入校门时就已经才华出众,还是因为这些大学通过精选优秀人才、培养他们的竞争力而使得他们的“附加值”增加,又或者两者都有?
1702644469
1702644470 我们还是不能通过随机实验的方法来回答这个问题。很少有高中毕业生愿意被随机分配到一所大学就读,哈佛和达特茅斯大学肯定也不愿意接收随机分配给它们的学生。研究似乎陷入了僵局,到底怎么样才能检验大学教育的效果呢?开动脑筋就能找到出路!两位经济学家斯塔西•戴尔和阿兰•克鲁格发现,其实有很多学生在高中毕业时会同时申请多所大学,通过对这一事实的“挖掘”,研究出现了转机。一些学生被名牌大学录取之后便高高兴兴地去报到了,而有一些学生在收到名牌大学的录取通知书后,经过再三考虑,还是去了普通大学或学院深造。于是现在我们就有了一个实验组(进入名牌大学学习的同学)和一个非对等对照组(凭才华和实力足以进入名牌大学却选择去竞争没那么激烈的高校学习)。
1702644471
1702644472 戴尔和克鲁格对两个组学生的纵向数据进行了分析。虽然这不是一个苹果对苹果的完美比较,而且收入只不过是人生成就的一部分,但他们的发现应该能够舒缓高中生及其父母的紧张情绪。毕业于名牌大学的人在收入方面并没有超过实力相当,但选择就读一般大学的人,唯一的例外就是出生于低收入家庭的人,他们从名牌院校毕业后的收入会有明显的增长优势。戴尔和克鲁格的方法有效地将实验效果(在名牌大学读4年书)从选择效果(最有才华的学生都被名牌大学挑走了)中剥离了出来。阿兰•克鲁格在《纽约时报》上撰文指出,“相比起毕业证书上的学校名字,正确认识自己的兴趣、抱负和能力更能成就人的一生”,这其实也间接回答了本章开头所提出的那个问题。
1702644473
1702644474 差分类差分实验。观察原因和结果的一个最佳方式就是放手去做,然后看看会发生什么,因为这就是婴儿和小孩(有时候也包括成年人)认识世界的途径。我的小孩很快就发现,如果他们在厨房乱扔食物(原因),家里的小狗就会兴高采烈地追着食物跑(结果)。当然,同样的观察方式也可以帮我们认识生活中的其他现象。假如美国政府推出了减税政策,经济就会跟着好转,那么减税政策一定是经济的助推剂。
1702644475
1702644476 然而,这一方式存在着一个巨大的陷阱:生活可比在厨房扔食物复杂多了。的确,政府的减税政策或许正好在某个时间点出台,但在同一时期可能还有其他“介人”因素在发挥作用:越来越多的女性进入大学学习,互联网以及其他科技创新正在提升美国工人的生产效率,中国的人民币价值被低估,芝加哥小熊棒球队总经理被解雇,等等。无论减税政策出台后发生了什么事情,都不能只归功或归咎于减税政策本身。任何“前与后”类的分析均面临着一个挑战,那就是仅凭一件事情紧随另一件事情的发生,并不能推断两件事情之间存在因果关系。
1702644477
1702644478 “差分类差分”法可以通过两个步骤来明确某个介入因素的效果。首先,我们对某个群体接受某项介入因素或治疗之前和之后的数据进行比较,例如推广促进就业政策之前和之后某个县的失业率变化情况。其次,我们将这些数据与另一个没有推出就业政策的同类县同期的失业率情况进行比较。
1702644479
1702644480 重要的是,用于分析的两个对象除了是否有介入因素,其他方面的情况基本上都相似;因此,两个对象的观察结果若存在任何显着差异,就应该被认为是所评估的项目或政策的效果。举个例子,假设伊利诺伊州的一个县为了应对高失业率,推出了一个就业培训项目,但在接下来的两年时间里,失业率依然呈上升走势,这是不是就意味着就业培训项目失败了?谁能告诉我们答案?
1702644481
1702644482
1702644483
1702644484
1702644485 图14-1 就业培训项目对A县失业率的影响
1702644486
1702644487 也有可能存在其他宏观经济因素的作用,如经济的持续不景气等。在“差分类差分”法的指导下,我们对同期两个县的失业率变化情况进行比较,其中一个县推广了就业培训项目,另外一个县并没有推广,除此之外两个县在其他方面都必须保持一致:相同的工业构成、相似的人口结构等。那么,推广了就业培训项目的县在失业率数据上的变化相比起另一个没有推广该项目的县,呈现了一幅什么光景呢?通过比较两个县相同时间段内的失业率变化,我们就能理性地推断出就业培训项目的效果了。这就是“差分类差分”,前一个差分表示项目推广前后的失业率变化,后一个差分指的是两个县同期的失业率变化差异。另一个没有推广就业培训项目的县在研究过程中扮演的是对照组的角色,有利于我们更好地理解项目实施前后的数据变化,因为对照组会受到跟实验组一样的宏观经济的作用。最初我们认为就业培训项目一无是处(因为在项目实施之后失业率变得更高了),但是对照组为我们展示了更加糟糕的就业情况,因此通过综合比较和分析,就业培训项目的正面作用就显现出来了。
1702644488
1702644489
1702644490
1702644491
1702644492 图14-2 就业培训项目对A县就业率的影响(以B县为参照物)
1702644493
1702644494 不连续分析实验。实验组和对照组还存在一种设置方式,就是将那些刚好符合介入或治疗条件的对象,以及以毫厘之差错失治疗机会的对象进行比较。那些刚好超过或略微不足规定条件(如考试分数或最低家庭收入等)的个人,其实在许多重要方面与实验组里的个人相差无几,而一组对象接受治疗、另一组对象不接受治疗的人为划分其实本身就是非常任意的。因此,比较这两类对象可以为我们提供有关介入或治疗效果的有益参考。
1702644495
1702644496 假设某个学区要求各个学校利用暑假的时间为成绩不理想的学生开设补习班,主管教育的领导想要知道暑期补习班项目是否具有长期推广的价值。当然,如果只是简单地比较参加补习班的学生和不参加补习班的学生,结果将会是毫无意义的。那些学生之所以会出现在暑期补习班里就是因为他们的成绩不好,就算暑期补习班的效果立竿见影,这些学生还是难以在考试中超过班上其他不需要参加补习班的同学。我们真正关心的是,这些学生在参加完补习班之后的成绩与参加补习班之前相比是不是提高了。是的,我们可以组织一些控制对照实验来将成绩不理想的学生随机分配到暑期补习班组或“闲置在家”组,但这可能会剥夺一些想要寻求上进的学生提高成绩的机会。
1702644497
1702644498 所以,我们的实验组和对照组应该来自那些正好在班上成绩居中的同学,有一些学生刚好被老师安排到补习班,有一些学生差一点儿就失去了自由自在的暑假时光。设想一下:那些在期中考试中成绩不及格的学生肯定与考试及格的学生是不一样的,但一个分数为59分(不及格)的同学与一个分数刚好为60分(通过考试)的同学呢?如果那些在期中考试中成绩不及格的学生必须参加补习班,那么一个合理且有意义的实验组和对照组就应该在那些差一点儿就及格的学生(参加补习班)和差一点儿就不及格的学生(不需要参加补习班)中产生,这两组学生的期末成绩将会是我们关注的重点。
1702644499
[ 上一页 ]  [ :1.70264445e+09 ]  [ 下一页 ]