打字猴:1.70264447e+09
1702644470 我们还是不能通过随机实验的方法来回答这个问题。很少有高中毕业生愿意被随机分配到一所大学就读,哈佛和达特茅斯大学肯定也不愿意接收随机分配给它们的学生。研究似乎陷入了僵局,到底怎么样才能检验大学教育的效果呢?开动脑筋就能找到出路!两位经济学家斯塔西•戴尔和阿兰•克鲁格发现,其实有很多学生在高中毕业时会同时申请多所大学,通过对这一事实的“挖掘”,研究出现了转机。一些学生被名牌大学录取之后便高高兴兴地去报到了,而有一些学生在收到名牌大学的录取通知书后,经过再三考虑,还是去了普通大学或学院深造。于是现在我们就有了一个实验组(进入名牌大学学习的同学)和一个非对等对照组(凭才华和实力足以进入名牌大学却选择去竞争没那么激烈的高校学习)。
1702644471
1702644472 戴尔和克鲁格对两个组学生的纵向数据进行了分析。虽然这不是一个苹果对苹果的完美比较,而且收入只不过是人生成就的一部分,但他们的发现应该能够舒缓高中生及其父母的紧张情绪。毕业于名牌大学的人在收入方面并没有超过实力相当,但选择就读一般大学的人,唯一的例外就是出生于低收入家庭的人,他们从名牌院校毕业后的收入会有明显的增长优势。戴尔和克鲁格的方法有效地将实验效果(在名牌大学读4年书)从选择效果(最有才华的学生都被名牌大学挑走了)中剥离了出来。阿兰•克鲁格在《纽约时报》上撰文指出,“相比起毕业证书上的学校名字,正确认识自己的兴趣、抱负和能力更能成就人的一生”,这其实也间接回答了本章开头所提出的那个问题。
1702644473
1702644474 差分类差分实验。观察原因和结果的一个最佳方式就是放手去做,然后看看会发生什么,因为这就是婴儿和小孩(有时候也包括成年人)认识世界的途径。我的小孩很快就发现,如果他们在厨房乱扔食物(原因),家里的小狗就会兴高采烈地追着食物跑(结果)。当然,同样的观察方式也可以帮我们认识生活中的其他现象。假如美国政府推出了减税政策,经济就会跟着好转,那么减税政策一定是经济的助推剂。
1702644475
1702644476 然而,这一方式存在着一个巨大的陷阱:生活可比在厨房扔食物复杂多了。的确,政府的减税政策或许正好在某个时间点出台,但在同一时期可能还有其他“介人”因素在发挥作用:越来越多的女性进入大学学习,互联网以及其他科技创新正在提升美国工人的生产效率,中国的人民币价值被低估,芝加哥小熊棒球队总经理被解雇,等等。无论减税政策出台后发生了什么事情,都不能只归功或归咎于减税政策本身。任何“前与后”类的分析均面临着一个挑战,那就是仅凭一件事情紧随另一件事情的发生,并不能推断两件事情之间存在因果关系。
1702644477
1702644478 “差分类差分”法可以通过两个步骤来明确某个介入因素的效果。首先,我们对某个群体接受某项介入因素或治疗之前和之后的数据进行比较,例如推广促进就业政策之前和之后某个县的失业率变化情况。其次,我们将这些数据与另一个没有推出就业政策的同类县同期的失业率情况进行比较。
1702644479
1702644480 重要的是,用于分析的两个对象除了是否有介入因素,其他方面的情况基本上都相似;因此,两个对象的观察结果若存在任何显着差异,就应该被认为是所评估的项目或政策的效果。举个例子,假设伊利诺伊州的一个县为了应对高失业率,推出了一个就业培训项目,但在接下来的两年时间里,失业率依然呈上升走势,这是不是就意味着就业培训项目失败了?谁能告诉我们答案?
1702644481
1702644482
1702644483
1702644484
1702644485 图14-1 就业培训项目对A县失业率的影响
1702644486
1702644487 也有可能存在其他宏观经济因素的作用,如经济的持续不景气等。在“差分类差分”法的指导下,我们对同期两个县的失业率变化情况进行比较,其中一个县推广了就业培训项目,另外一个县并没有推广,除此之外两个县在其他方面都必须保持一致:相同的工业构成、相似的人口结构等。那么,推广了就业培训项目的县在失业率数据上的变化相比起另一个没有推广该项目的县,呈现了一幅什么光景呢?通过比较两个县相同时间段内的失业率变化,我们就能理性地推断出就业培训项目的效果了。这就是“差分类差分”,前一个差分表示项目推广前后的失业率变化,后一个差分指的是两个县同期的失业率变化差异。另一个没有推广就业培训项目的县在研究过程中扮演的是对照组的角色,有利于我们更好地理解项目实施前后的数据变化,因为对照组会受到跟实验组一样的宏观经济的作用。最初我们认为就业培训项目一无是处(因为在项目实施之后失业率变得更高了),但是对照组为我们展示了更加糟糕的就业情况,因此通过综合比较和分析,就业培训项目的正面作用就显现出来了。
1702644488
1702644489
1702644490
1702644491
1702644492 图14-2 就业培训项目对A县就业率的影响(以B县为参照物)
1702644493
1702644494 不连续分析实验。实验组和对照组还存在一种设置方式,就是将那些刚好符合介入或治疗条件的对象,以及以毫厘之差错失治疗机会的对象进行比较。那些刚好超过或略微不足规定条件(如考试分数或最低家庭收入等)的个人,其实在许多重要方面与实验组里的个人相差无几,而一组对象接受治疗、另一组对象不接受治疗的人为划分其实本身就是非常任意的。因此,比较这两类对象可以为我们提供有关介入或治疗效果的有益参考。
1702644495
1702644496 假设某个学区要求各个学校利用暑假的时间为成绩不理想的学生开设补习班,主管教育的领导想要知道暑期补习班项目是否具有长期推广的价值。当然,如果只是简单地比较参加补习班的学生和不参加补习班的学生,结果将会是毫无意义的。那些学生之所以会出现在暑期补习班里就是因为他们的成绩不好,就算暑期补习班的效果立竿见影,这些学生还是难以在考试中超过班上其他不需要参加补习班的同学。我们真正关心的是,这些学生在参加完补习班之后的成绩与参加补习班之前相比是不是提高了。是的,我们可以组织一些控制对照实验来将成绩不理想的学生随机分配到暑期补习班组或“闲置在家”组,但这可能会剥夺一些想要寻求上进的学生提高成绩的机会。
1702644497
1702644498 所以,我们的实验组和对照组应该来自那些正好在班上成绩居中的同学,有一些学生刚好被老师安排到补习班,有一些学生差一点儿就失去了自由自在的暑假时光。设想一下:那些在期中考试中成绩不及格的学生肯定与考试及格的学生是不一样的,但一个分数为59分(不及格)的同学与一个分数刚好为60分(通过考试)的同学呢?如果那些在期中考试中成绩不及格的学生必须参加补习班,那么一个合理且有意义的实验组和对照组就应该在那些差一点儿就及格的学生(参加补习班)和差一点儿就不及格的学生(不需要参加补习班)中产生,这两组学生的期末成绩将会是我们关注的重点。
1702644499
1702644500 判处犯罪的青少年监禁,是否可以预防他们今后再次犯罪?这个问题我们也可以用不连续分析法来解决。显而易见,这类分析不能简单地比较坐牢的与量刑较轻的青少年罪犯的累犯率,因为被判坐牢的青少年肯定是因为犯下了比其他同龄人更加严重的错误才受此惩罚。我们更不能用随机分配刑罚的方式来设置实验组和对照组(除非你下次闯了红灯,为了免除刑罚而愿意冒25年监禁的风险)。伦敦大学研究员兰迪·加尔马森曾在美国华盛顿州开展了一项关于青少年犯罪的调查,试图弄清严厉的刑罚与青少年今后的犯罪行为之间是否存在某种相关性。具体来说,她比较了那些刚好够得上判处入狱与刚好逃过“牢狱之灾”(通常只需要罚款或保释)的两群青少年的累犯率。
1702644501
1702644502 华盛顿州的司法体系专门设计了一个坐标轴来为每一位犯错误的青少年定刑。X轴表示的是他们以前犯过的错,例如一次重罪就记1分,一次轻罪就记1/4分,全部加起来就是X轴上的读数。与此同时,Y轴表示的是当前所犯罪行的严厉程度,级别从E(最不严重)一直到A+(最为严重)。那么,最后的定刑就是根据他们以前和现在犯错的严重程度在坐标轴上体现的位置。假如一个人之前所有的错误加起来为2分,这次又犯了一个级别为B的重罪,那么他将在青少年监狱待上15~36个月;假如一个人过去所积累的错误只有1分,这次又犯了同样的罪,根据坐标轴的显示,他将不会被送入监狱。正是这种刑罚的不连续性激发了研究人员的灵感,加尔马森比较了正好够得上坐牢和正好免去牢狱刑罚的两群青少年罪犯,她在论文中解释道:“假如两个人都犯了级别为C+的罪,其中一个人之前的累计犯罪分数为2.75,另一个人的累积犯罪分数为3,那么只有后者才会被判处坐牢。”
1702644503
1702644504 从研究的角度考虑,这两个人几乎完全相同,除了有一个人要去坐牢。但从判决书下来的那一天起,他们两人的行为就进入了完全不同的演变轨道。被判处坐牢的青少年出狱后再次犯罪的概率会显着降低。
1702644505
1702644506 无论在医学、经济、商业、司法还是其他任何领域,我们总是在关心治疗或介入手段是不是真的起了作用。但是,因果关系是一根难啃的骨头,我们有时候甚至连明显得不能再明显的原因和结果都无法确定。为了了解某种介入手段或治疗真正的效果,我们需要看到“反现实——事实的背面”,即假如没有介入手段或治疗会发生什么。但是在许多时候,“事实的背面”却没有那么容易甚至不可能被发现。举个例子:人侵伊拉克让美国变得更加安全了吗?
1702644507
1702644508 这个问题在学术上只有唯一的答案:我们永远也不知道。原因就是,我们不知道也无法知道假如美国没有人侵伊拉克会发生什么。的确,美国没有在伊拉克发现大规模杀伤性武器,但谁能保证美国哪一天若真的按兵不动,萨达姆晚上在洗澡的时候会不会灵机一动从其他国家买一枚氢弹回来?那之后又会发生什么,谁能知晓?
1702644509
1702644510 当然,完全有可能在美国按兵不动的那天晚上,萨达姆一边准备洗澡一边在头脑中想着从哪里买氢弹的时候,脚下一滑,后脑勺磕在了大理石浴缸上一命呜呼了。如果真的是那样,那美国就不用花费那么大的代价来除掉萨达姆了。
1702644511
1702644512 对于任何一个项目评估来说,其目的都是为评价治疗或介人手段的效果提供某种“反现实”。在随机控制实验中,对照组就是“反现实”,但当对照实验不具有可行性或有违道德时,我们就需要寻求其他方式来模拟“反现实”。对这个世界的探索在很多时候就依赖于寻找“反现实”的聪明才智。
1702644513
1702644514
1702644515
1702644516
1702644517 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 [:1702642315]
1702644518 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 结束语
1702644519
[ 上一页 ]  [ :1.70264447e+09 ]  [ 下一页 ]