打字猴:1.70264437e+09
1702644370 假如回归方程式中遗漏了某个重要的解释变量,尤其是当方程式中的其他变量又恰好“覆盖”了遗漏的解释变量的影响,那么回归分析的结果就会变得非常具有误导性,甚至与真相背道而驰。假设我们要评估学校质量,必须了解的一点是:什么样的学校才是好学校?我们的因变量即质量的量化衡量指标,最有可能是考试分数。基本可以肯定的是,我们会将学校的开销作为一个解释变量,希望能够量化开销和分数之间的关系。花钱花得多的学校在统考中的分数也会更高一些吗?假如学校开销是唯一的解释变量,那么毫无疑问,我们将会在开销和考试分数之间寻找到具有显着统计学意义的相关关系。但是,这样的一个暗示“分数可以通过大量花钱推升”的发现,是存在巨大漏洞的。
1702644371
1702644372 有许多重要的潜在解释变量在分析中被遗漏了,其中最关键的一个变量就是家长的教育。受教育程度高的家庭更有可能住在相对富裕的地区,配套的学校设施更好,开销自然更大,培养出来的孩子在考试中的表现也更有可能比穷人家的孩子出色。假如在回归分析中没有将学生群体所在家庭的社会经济地位作为解释变量进行控制,那么回归分析结果将极有可能显示学校开销和考试分数之间存在显着的正相关关系。而实际上,分数的高低取决于跨进校门的学生的优劣,而不是教学楼的造价高低。
1702644373
1702644374 我记得一位大学教授曾经指出,SAT考试分数与家庭的汽车数量之间存在高度的相关性。因此,这位教授暗示SAT在大学录取这个问题上是一个非常不公平、不适合的参考工具。SAT的确存在缺陷,但我最关心的并不是这门考试与家庭汽车数量之间的相关关系——富裕的家庭就算额外再购买3辆汽车,也无法保证将孩子送进大学。私人车库里的汽车数量在一定程度上反映了这个家庭的收入、教育等社会经济地位的高低,而富人家的孩子在SAT考试中的表现优于穷人家的孩子早已不是什么新闻(前文提到,家庭收入高于20万美元的孩子的SAT阅读理解部分的平均分要比家庭收入低于两万美元的孩子高出134分)。一个更大的隐忧在于,SAT高分是不是可以被“训练”出来的?学生通过参加考前私人培训能够提高多少分?假如培训和分数之间存在任何的正相关关系,那么家境好的孩子就容易占到“便宜”。假如两个天资和能力都相同的孩子,一个来自于富人家庭,一个来自于穷人家庭,前者参加了考前培训并取得了不错的成绩,而后者本来也可以考出一样的高分,但由于家境因素没有机会参加培训SE,不得已在考试中处于劣势。
1702644375
1702644376 高度相关的解释变量(多元共线性)。在一个回归方程式中,假如两个或两个以上解释变量彼此之间高度相关,那么回归分析的结果将有可能无法分清每一个变量与因变量之间的真实关系。举例说明,假设我们想要知道吸毒对SAT考试分数的影响,我们会询问研究对象是否吸食过可卡因或海洛因(并且假设已经对其他许多变量进行了控制),并使用回归分析的方法,在控制其他变量的基础上(包括海洛因的使用),计算出可卡因对SAT考试分数的影响;再同理计算出海洛因对考试的影响。
1702644377
1702644378 但即使我们最后分别求出了海洛因和可卡因的回归系数,依然无法揭开真实的情况。方法论上的一大挑战在于,通常吸食可卡因的人同时也在吸食海洛因,只吸食过其中一种毒品的人的人数非常少,因此在计算两种毒品的独立影响时能用得上的数据量非常小,而且差异将不会很大。回到上一章用来解释回归分析的那个虚拟场景,我们将数据样本分配到不同的“房间”里,每个房间里的人除了某个变量不同,其他全都相同,这样我们就能在控制其他潜在混淆因素的前提下观察某一个因素对结果的影响。在我们的样本人群中,可能有692个人曾经吸食过可卡因和海洛因,但有3个人只吸食过可卡因,2个人只吸食过海洛因。任何有关海洛因或可卡因的独立影响的统计推断,都只能从这些微小的数据中来。
1702644379
1702644380 无论是可卡因还是海洛因的回归系数都不可能告诉我们有统计学意义的结论,而且还会让SAT成绩与吸食毒品之间的关系变得更加扑朔迷离。当两个解释变量高度相关时,研究人员通常会在回归方程中只采用其中一个,或创造一个新的综合变量,如“吸食过可卡因或海洛因”。例如,当研究人员想要控制学生的整体经济背景时,他们会将父母双方的受教育程度都纳入方程式中,因为这才是家庭教育背景的有益参考。但是,如果回归分析的目标是单独隔离父亲或母亲的受教育程度,那么将两个因素都纳入考虑范围反而会引起混淆,让分析变得模糊。丈夫和妻子的受教育程度存在着相当大的相关性,以至于我们无法通过回归分析得出一个有意义的关于某个家长的教育程度系数(就好像我们难以区分可卡因和海洛因对考试的影响一样)。
1702644381
1702644382 脱离数据进行推断。和所有其他形式的统计推断一样,回归分析的目的是帮助我们更好地认识这个世界,发现能够适用于所有人口的规律。但需要强调的是,我们的结论仅仅是对与所分析样本相似的人口有效。在上一章中,我设计了一个回归方程,通过几个独立的解释变量来预测体重,最终我的模型的R2为0.29,表示其能够较好地解释大量个体不同的体重,而且大量的个体恰好都是成年人。
1702644383
1702644384 当我们用这个回归方程式来预测新生儿的体重时,又会发生什么呢?现在就来试一试。我的女儿在出生时身高为21寸,年龄设定为零,教育程度为零,锻炼为零,她还是一个白人女性。再将这些信息输入到由“变化的一生”数据样本得到的回归方程式中去,计算出我刚出生的女儿体重为-19.6磅(而实际上,她刚出生时的体重为8.5磅)。
1702644385
1702644386 上一章所提到的“白厅”研究项目的作者在给出结论时就明确地规定了适用范围,可以说具体得不能再具体了:“从事缺乏控制力的工作将会增加未来患上冠心病的风险,该结论仅适用于受雇于政府部门的男性和女性。”
1702644387
1702644388 数据矿(变量过多)。假如遗漏重要的解释变量会带来诸多麻烦,那是不是就是说在回归方程式中加入大量解释变量,而且加入的变量越多越好,就一定可以解决问题了呢?并不是,物极必反。
1702644389
1702644390 假如变量过多,尤其当无关变量过多的时候,回归分析的结果就会被冲淡或稀释。举个例子,我们在设计研究策略时千万不能按如下方法行事:既然我们不知道是什么引起了自闭症,那就应该在回归方程式中加入尽可能多的潜在解释变量,看看最后有哪些变量具备显着的统计学意义,到那个时候我们或许就会得到一些答案了。如果在回归方程式中加入了足够多的无关变量,那么总会有一个恰好达到显着性水平的门槛,而且像这类无关变量并不是那么容易被察觉的。至于为什么某些在实际操作中说不通的变量在方程式里具有了显着的统计学意义,聪明的研究人员总是能够在事后建立理论模型时给出解释。
1702644391
1702644392 为了说明这一点,我经常会回到介绍概率时所举的那个抛硬币的例子。在一个约40人的班级里,我会让每一个学生都抛一枚硬币,抛到反面朝上的学生自动退出,剩下的接着抛,在第二轮中,抛到反面朝上的学生退出,剩下的接着抛第三轮,就这样一直进行下去,直到有一个学生一连抛出五六次正面朝上的结果。或许你还记得对那个学生提出的一些搞笑问题:“你的秘密是什么?诀窍是在手腕吗?你能教大家怎么使硬币一直正面朝上吗?有没有可能是因为你今天穿了哈佛大学的文化衫?”
1702644393
1702644394 连续抛硬币的结果都是正面朝上显然只是凭运气,周围的学生都是见证人。但是,统计学却有可能不这么认为。连续5次抛出正面朝上的概率为1/32,约0.03,完全低于我们通常要推翻零假设时所定的0.05的门槛。在这个例子中,我们的零假设是学生抛硬币时并不存在特殊能力;而刚刚连续抛出5次正面朝上的运气(如果我召集了大量学生参与实验,那么这种情况至少能够发生在一位同学身上)就足以让我们推翻零假设,宣布备择假设成立,即这位学生拥有抛硬币总是正面朝上的特殊能力。在他结束了这一令人印象深刻的“神技”表演之后,我们便可以从他下手,寻找成功抛硬币的蛛丝马迹了:他抛硬币的动作、他的体育训练、当硬币在空中时他的注意力放在哪里,等等。自然,所有这一切到最后都可以用“荒唐”二字来概括。
1702644395
1702644396 这一现象甚至还蔓延到了正式、严肃的研究中。一个广为接受的研究惯例是,在零假设成立的前提下,如果某个概率小于或等于1/20的偶然结果真的发生了,则我们就可以推翻零假设。当然,假如我们进行20次试验,或在某个回归方程式中加入20个无关变量,那么一般说来就会出现一个具有统计学意义的伪发现。《纽约时报》就引用了医学统计专家和流行病学家理查德•彼托的话很好地概括了这一令人不安的现实:“流行病学是一门如此美妙的学科,为我们了解人类生命和死亡提供了重要的视角,但同时也出版了多得令人咋舌的学术垃圾。”
1702644397
1702644398 甚至连医学研究的黄金标准——采取随机抽样的临床试验都应该以怀疑的眼光来审视。2011年,《华尔街日报》头版刊登了一篇有关医学研究的“一个不可见人的秘密”的文章,报纸这样写道:“绝大部分的试验结果,包括那些刊登在顶级同行间审阅的学术期刊上的论文,都是无法复制的。”(同行间审阅期刊上的研究成果和文章,在刊登之前都需要经过同领域的其他专家的审阅以确保研究的可靠性,这类刊物被视作学术研究成果的“把关人”。)之所以会有这样一个“不可见人的秘密”,其中一个原因就是在前面的章节中介绍的“发表性偏见”,如果研究人员和医学杂志大量关注肯定性发现而忽略否定性发现,那么它们就有可能发表唯一的一篇结论为某试验药物有效的论文,而忽略其他19篇证明该药物没有疗效的论文。某些临床试验同样有可能采用小型样本(比如某一种罕见的疾病),这样就提升了观察结果中一些随机偏离的数据在统计的过程中被过度重视的可能性。此外,研究人员可能原本就具有一些有意无意的偏见,或者是出于某个先入为主、根深蒂固的观点,或者是因为某项肯定性发现对他们的事业更有帮助(毕竟,没有人会因为证明某药不能治愈癌症而发财或出名的)。
1702644399
1702644400 出于上述种种原因,有大量发表的专家研究最后被证明是错误的。希腊医生和流行病学家约翰•艾奥尼蒂斯对3本最有声望的医学期刊里刊登的49篇学术研究论文进行了统计,每一篇论文的研究发现都被转引了至少1000次,但其中差不多有1/3的研究成果都被后续的研究否定了。(例如,有一些研究是支持雌激素补充疗法的)。根据艾奥尼蒂斯博士的观察,在已经出版的科学论文中,差不多有1/2最终会被证明是错误的。他的研究成果刊登在《美国医学协会学报》上,有趣的是这就是他所研究的3本期刊中的其中一本。这难免令人产生困惑:假如艾奥尼蒂斯博士的研究发现是正确的,那他的研究发现就很有可能是错误的。
1702644401
1702644402 无论怎么样,回归分析依然是一个非常棒的统计学工具(好吧,我承认上一章中将其形容为“神奇的万金油”有一点儿言过其实),它能够让我们从大型的数据样本中寻找到关键的相关关系,而这些相关关系又通常是重要的医学和社会科学研究的关键所在。统计学为我们在评价这些相关关系时提供了客观的标准,如果使用得当,回归分析将会是科学方法的一个重要组成部分。那么,就把这一章看作必须引起重视的警示篇吧。
1702644403
1702644404 本章精选的所有警示其实都可以浓缩为两个基本经验。第一,设计一个好的回归方程式,想清楚应该考虑哪些变量、应该从哪里收集数据,一个好的方程式要比统计计算本身更加重要。这个过程可以通过对方程式的评价和回归方程的具体化来实现。优秀的研究人员能够对变量进行逻辑思考,决定哪些变量可以加入到回归方程式中,发现还有哪些遗漏的变量,以及正确解读最终的分析结果。
1702644405
1702644406 第二,与绝大部分统计推断一样,回归分析始终以观察样本为立足点。两个变量之间的相关关系就像是犯罪现场的一个指纹,能够为我们指出正确的方向,但在大多数时候还不足以定罪(有些时候在犯罪现场发现的指纹甚至都不是凶手的)。对于任何回归分析来说,都需要在以下方面得到理论支持:为什么方程式里要有这些解释变量?通过其他学科领域是否也能解释这个分析结果?例如,我们为什么会认为穿紫色鞋子可以提高SAT考试数学部分的成绩?为什么吃爆米花可以帮助预防前列腺癌?分析得出的结论需要具有可复制性,至少也得与其他科学发现相一致。
1702644407
1702644408 如果不按指示操作,那么就算是“神奇的万金油”也会失效的。
1702644409
1702644410
1702644411
1702644412
1702644413 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 [:1702642314]
1702644414 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第14章 项目评估与“反现实”
1702644415
1702644416 哈佛大学等世界顶尖大学的毕业生进入社会后,其收入往往高于一般大学的毕业生,让他们获得高收入的究竞是常春藤大学的教育优势,还是他们本身就很出色?
1702644417
1702644418 出色的研究者之所以出色,并不是因为他们不用纸笔就可以在脑中进行复杂的计算,也不是因为他们总能在电视智力竞赛中赢得更多的奖品(虽然这些本领也很重要)。这些改变了我们的知识世界的研究者之所以能够得到我们的尊敬和崇拜,主要是因为他们作为个人或团队,总是能够找到有创意的方式来控制变量,使得对照实验能够进行下去。在对某项疗法或某种介人手段进行测量时,我们需要制定一些类似于标尺的东西来提供参照。上哈佛大学会给你的人生带来什么影响?要回答这个问题,我们就必须知道你去哈佛大学读书以后发生了什么,如果没去哈佛大学读书又发生了什么。显然,这两个数据我们是无法兼得的,但聪明的研究者就能找到有创意的方式来测量某种疗法或介人手段(比如去哈佛大学念书)的影响,也就是在现实与“反现实”(在介入手段缺失的前提下所发生的结果)之间搭建比较的桥梁。
1702644419
[ 上一页 ]  [ :1.70264437e+09 ]  [ 下一页 ]