1701026160
1701026161
但是,这种做法仍然不正确。在4月时会发生回归平均值的现象,到了7月,这个现象同样会发生。
1701026162
1701026163
球员们通常都会受到这个现象的影响。人们预测德瑞克·基特(Derek Jeter)有望打破皮特·罗斯(Pete Rose)保持的安打纪录,基特因此备受困扰,他告诉《纽约时报》的记者:“体育竞技中最不应该说的话就是‘有望如何如何’。”他的话非常有道理。
1701026164
1701026165
假设到全明星赛时,我的本垒打次数在全联盟排名第一,那么在剩下的比赛中我可以打出多少次本垒打?
1701026166
1701026167
全明星赛把棒球赛季分成了“上半赛程”和“下半赛程”,下半赛程实际上要短一些,最近几年,下半赛程的比赛场次只有上半赛程的80%~90%。因此,大家预测我下半赛程的本垒打次数可能是上半赛程的85%左右。
1701026168
1701026169
但是,从以往的情况看,这种预测是不对的。为了找出其中的原因,我研究了1976~2000年在美国棒球大联盟19个赛季的上半赛程中本垒打次数最多的那些球员(不包括因为罢工导致赛程缩水的赛季和上半赛程本垒打次数出现并列第一名情况的赛季)。在全明星赛之后的下半赛程,只有三名球员——1978年的吉姆·莱斯(Jim Rice)、1980年的本·奥利维(Ben Oglivie)和1997年的马克·麦维尔(Mark McGwire)——的本垒打次数为上半赛程的85%。1993年,到全明星赛阶段以24次本垒打领先全联盟的米奇·泰托顿(Mickey Tettleton),在下半赛程只打出了8次本垒打,而且每个赛季都会有击球手的情况与此类似。在上半赛程领先其他球员后,这些优秀击球手在下半赛程的本垒打次数平均为上半赛程的60%左右。之所以出现这种下降趋势,不是因为身体疲劳或者8月天气炎热等,否则,整个联盟的本垒打数据也会出现下降趋势。其实原因很简单,即回归平均值现象。
1701026170
1701026171
受它影响的不仅仅是联盟中的那些本垒打高手。每年在全明星赛的本垒打大赛中,优秀的棒球选手利用自动投球器喂球,试图尽可能多地打出超大号本垒打。有的击球手抱怨说,在本垒打大赛后的几周时间内很难打出本垒打,他们把这种影响叫作“本垒打大赛的诅咒”。2009年,《华尔街日报》刊登的一则名为“本垒打大赛的神秘诅咒”的新闻令人瞠目结舌,有统计学知识的棒球博主对其进行了严厉的驳斥,但《华尔街日报》却对他们的批评置若罔闻,于2011年再次刊登了观点相近的文章——“本垒打大赛的诅咒再次发威”。但是,所谓的诅咒纯属子虚乌有。球员们之所以能登上本垒打大赛的赛场,是因为他们在赛季之初表现突出。由于回归效应,他们在赛季后期打出的本垒打次数肯定会减少。
1701026172
1701026173
2012年5月,马特·坎普的腘绳肌拉伤,停赛一个月。等到他伤愈复出时,他的状态明显不如受伤前。因此,他在那个赛季打出的本垒打次数不是86次,而是23次。
1701026174
1701026175
人们有时会出于某种原因而不愿意接受回归平均值的现象,他们更愿意相信是某种力量把那些强大的存在拉下了神坛,而1889年高尔顿的“强大的存在常常徒有其表”的观点并不能得到我们的认同。
1701026176
1701026177
霍林特与西克里斯特的论战
1701026178
1701026179
西克里斯特对这个重要观点并不了解,不过具有数学思维的研究人员却非常清楚。虽然西克里斯特的研究得到了评论者的普遍尊重,但是也有人表示反对。他从统计学角度批评了西克里斯特的研究,而且抨击得非常有道理,这个人就是《美国统计学会杂志》(Journal of the America Statistical Association)的哈罗德·霍特林(Harold Hotelling)。霍特林是明尼苏达人,他的父亲是一位干草经销商。他上大学期间学的是新闻学专业,但却发现自己在数学方面颇具天赋。(如果弗朗西斯·高尔顿当初研究美国名人的遗传情况,那么他会非常惊喜地发现,尽管霍特林出身卑微,但是他的先辈中有一位马萨诸塞湾殖民地的官员和一位坎特伯雷大主教)。与亚伯拉罕·瓦尔德一样,霍特林在普林斯顿大学就读期间学的是理论数学,博士论文写的是代数拓扑学方面的内容。如果他继续研究理论数学,就有可能担任纽约战时统计研究小组的领导人。1933年,在西克里斯特的著作出版时,霍特林还是哥伦比亚大学的一位年轻老师,但他已经在理论统计学,特别是与经济问题有关的统计学领域,做出了非常重要的贡献。据说,他喜欢在头脑中玩“地产大亨”游戏,他能记住游戏的棋盘以及各种随机牌与社区福利牌出现的频率,这个游戏对他来说就是生成随机数字和心算等非常简单的活动。这足以表明霍特林的智力水平与他的喜好。
1701026180
1701026181
霍特林全身心地投入研究,他认为西克里斯特与自己有相似之处,因此撰文对他的研究表示赞同,“直接收集数据的工作量肯定非常大”。
1701026182
1701026183
但接下来却是对西克里斯特的批评。霍特林指出,只要研究的变量同时受到稳定因素和随机性的影响,那么平庸状态的胜利就或多或少是一种必然结果。西克里斯特列举的数百个图表,“除了能证明他所研究的各种比率表现出徘徊的趋势以外,没有任何其他价值”;他的彻底调查的结果“总的说来显而易见,根本不需要引用大量数据加以证明”。霍特林仅列举了一个关键性的观察结果,就清楚地表明了自己的观点。西克里斯特认为回归平庸状态是长期竞争的结果,1916年的优质商店到了1922年仅勉强居于中上游水平,造成这种局面的原因就是竞争。但是,如果研究对象是1922年业绩最优秀的那些商店,我们又会得出什么结果呢?根据高尔顿的分析,这些商店取得良好业绩的原因可能是自身经营有方,也可能是运气不错。如果回溯至1916年,这些公司在1922年采用的优秀管理方法应该具有同样的效果,但是它们的运气可能完全不同。因此,在1916年,这些公司中的绝大多数业绩应该趋近于平庸。换言之,按照西克里斯特的观点,回归平均值是竞争的必然结果,无论时间向前还是向后推移,都会产生相同的影响。
1701026184
1701026185
霍特林对西克里斯特的批评并不严厉但是语气坚定,遗憾的成分明显多于气恼。他认为西克里斯特是一位非常优秀的同行,而且他试图以最温和的方式告诉后者:他的这10年时间算是白白浪费了。但是,西克里斯特并没有领会霍特林的意图,他在随后的一期《美国统计学会杂志》上发表了一篇文章,回应霍特林对他的批评。西克里斯特认为霍林特的评论中有几处理解错误,而且,即使没有这些错误,后者的评论也明显偏离了重点。西克里斯特再次强调回归平庸状态不仅是统计学上的一个笼统原则,而且是根据“受竞争压力与调控措施共同影响的数据”得出的具体结果。事情发展到这个地步,霍特林也不再客气了,他直截了当地指出:“正确解读这本书,就会发现西克里斯特的主题基本没有任何价值……耗费大量时间与金钱,比较多个行业中企业的利润开支比,仅仅是为了‘证明’这样一个结果,这种行为就好比为了证明乘法表,先把大象排成方阵,再换其他多种动物做同样的实验。这种做法虽然有娱乐价值,也有一定的教学价值,但是并不会对动物界或者数学界有所贡献。”
1701026186
1701026187
糠麸对肠道消化真的有帮助吗?
1701026188
1701026189
我们不应该过分指责西克里斯特,即使是高尔顿本人,也花了20年左右的时间才弄清楚回归平均值的全部含义。其后,很多科学家都和西克里斯特一样误解了高尔顿提出的这个概念。生物统计学家瓦特尔·韦尔登(Walter F. R.Weldon)证明,高尔顿在人类特征变异性方面的发现同样适用于虾,他在1905年的一次报告中对高尔顿的研究做出了评价。
1701026190
1701026191
生物学家在使用高尔顿的这个方法时,很少有人会专门研究他采用这些方法的前因后果。我们发现,人们总是认为回归平均值是生物特有的属性,在它的作用下,差异的程度会在世代遗传的过程中逐渐减弱,而物种则保持不变。有人则简单地认为儿童的差异平均值小于其父辈,可能在他们看来,上述观点是站得住脚的。但是,这些人忘记了一个同样明显的事实:上一代也会相对于下一代发生回归,因此从整体来看,不正常儿童的上一代,其不正常的程度会小于他们的后代。明白了这个事实之后,他们要么把这个事实归因于下一代修正上一代不正常的能力也会发生回归,要么认识到他们正在讨论的这个现象到底说明了什么问题。
1701026192
1701026193
生物学家希望从生物学的角度探讨回归的原因,西克里斯特等经营管理学家认为回归源于竞争,文学评论家则把回归现象归因于创作能力枯竭。但是,他们都错了,回归是一个数学问题。
1701026194
1701026195
而且,尽管霍特林、韦尔登与高尔顿等人做出了努力,但是人们仍然没有彻底搞清楚回归这个概念。不仅《华尔街日报》体育版会犯错,科学家们也会犯错。1976年,《英国医学杂志》(British Medical Journal)发表的一篇介绍用糠麸治疗憩室病的文章,就是一个非常典型的例子。(1976年,我已经懂事了,所以我清楚地记得,当时关注健康的人对糠麸的推崇程度,堪比我们现在对欧米茄–3脂肪酸与防腐剂的重视程度。)该文作者记录了每个病人接受糠麸疗法前后的“消化道通过时间”(oral-anal transit time,即一顿饭从入口到排泄所需的时间)。他们发现糠麸有显著的调整作用,“对于消化道通过时间短的人,其消化速度减慢了,通过时间延长至接近48个小时……在通过时间适中的人身上没有引起任何变化……对通过时间长的人,其消化速度加快了,通过时间逐渐缩短至接近48个小时。因此,糠麸可以把过长与过短的消化道通过时间调整至接近48个小时”。其实,我们可以预测,即使糠麸没有任何效果,也会出现这样的结果。
1701026196
1701026197
换言之,无论肠道的健康状况如何,我们在消化方面花费的时间都会时短时长。如果我们在星期一那天的消化道通过时间异乎寻常地短,那么,无论有没有接受糠麸疗法,星期二的通过时间都会更接近平均水平。
1701026198
1701026199
“现身说法”计划的兴衰也属于这类案例。“现身说法”计划的目的是将少年犯带到监狱去听犯人的现身说法,警示他们如果不立即停止犯罪行径,等待他们的将是铁窗生涯。该计划起源于罗威州立监狱,在1978年被拍成纪录片并荣获奥斯卡奖之后,全美国乃至挪威的多个地方纷纷效仿。青少年热烈赞扬“现身说法”计划让他们在道德层面深受触动,而监狱中的看守与囚犯也因为有机会对社会做出积极贡献而高兴。但是,这个计划会让人们想到一个受到普遍认可而且根深蒂固的观念:青少年犯罪归咎于父母与社会对他们的过度溺爱。更重要的是,“现身说法”计划真的发挥了作用。新奥尔良的一份有代表性的报告说,实施该计划后,青少年犯罪率较以前下降了50%。
1701026200
1701026201
其实,这项计划的效果并没有那么明显。就像西克里斯特研究中的那些业绩不佳的商店一样,这些少年犯不是研究人员随机选择的研究对象,他们之所以被选中,是因为他们是同类人群中表现最差的。根据回归理论,如果这一年表现最恶劣,那么下一年仍然有可能会惹麻烦,但是概率并没有人们想象的那么大。即使“现身说法”计划没有任何效果,我们也可以预测到这些青少年的犯罪率会下降。
1701026202
1701026203
这并不意味着“现身说法”计划没有任何效果。人们在少年犯中随机选择了一部分人,让他们参与“现身说法”计划,然后同那些没有参与该计划的少年犯进行比较,以此来检验这项计划的效果。结果,研究人员发现,该计划竟然导致反社会行为有所增加。或许,给这项计划取名“以身试法”更合适。
1701026204
1701026205
[1]这个事实及其解读来自美国国家橄榄球联盟统计部门的布莱恩·伯克(Brian Burke)。伯克善于阐释并密切关注依据统计学做出的准确判断,是严谨认真的体育分析师的典范。
1701026206
1701026207
1701026208
1701026209
[
上一页 ]
[ :1.70102616e+09 ]
[
下一页 ]