1701024052
这则报道自然引起了英国公众的强烈反应。一位全科医师发现,女性病人看了这则报道之后,其中有12%的人立刻停止服用这种避孕药,转而服用不会引发血栓的其他避孕药。但是,一旦中止服用避孕药,就会对避孕效果产生影响,使怀孕人数增加。(大家不会以为我接下来会告诉你们这件事引发了禁欲浪潮吧?)此前,英国的生育率连续多年走低,但在1996年却增加了好几个百分点,英格兰与威尔士的怀孕人数比前一年增加了2.6万名。这么多的人意外怀孕,导致堕胎人数激增,1996年的堕胎人数比1995年增加了1.36万名。
1701024053
1701024054
血块在血液循环系统中横冲直撞,有可能会严重影响人的身体健康。与之相比,堕胎似乎微不足道。的确,我们可以想象有多少妇女因为CSM的警告而规避了肺栓塞致死的风险!
1701024055
1701024056
但是,到底有多少女性从中获益了呢?我们无法知道确切的数字。不过,一位支持CSM发布警告的科学家称,因为警告而逃过一劫的总人数“有可能仅为一人”。第三代避孕药的风险具有统计学显著性,但从医疗保健的角度看则没有那么明显的显著性。
1701024057
1701024058
但是,新闻报道加剧了人们的恐慌。CSM的信中指出了“风险率”(risk ratio):第三代避孕药会使妇女患血栓的风险增加一倍。如果不知道肺栓塞其实极少发生,我们就会以为这种情况十分危险。在服用第一代与第二代避孕药的育龄妇女中,每7 000人中可能有一人会患血栓。服用新型避孕药的确会使患血栓的风险加倍,也就是2/7 000的概率,但是这种可能性仍然非常小。“极小数的二倍仍然是一个极小数”这个数学事实已经得到了证明,某个数的二倍会产生什么样的影响,取决于这个数本身的大小!在“涂鸦拼字”游戏中,在双倍积分时拼出“ZYMURGY”(酿造学)这种7个字母的单词就是一次成功,但如果拼出来的是“NOSE”(鼻子)这种4个字母的单词,就错失良机了。
1701024059
1701024060
风险率这个概念,比1/7 000这样一个极小概率更容易理解。但是,用风险率来说明小概率事件时很容易误导人。纽约市立大学的几名社会学家完成的一项研究发现,接受家庭照料或由保姆照看的婴幼儿,其死亡率是上托儿所或幼儿园婴幼儿死亡率的7倍。大家先不要忙着解雇保姆,而应该考虑一下:在当今这个时代,美国很少发生婴幼儿死亡事件,即使真有不幸夭折的,也不是因为照料方面的过错。接受家庭照料的婴儿,其年死亡率为1.6/100 000,比托儿所或幼儿园的0.23/100 000高。但是,这两个概率都非常接近于零。纽约市立大学的这项研究指出,2010年由家庭照料的美国婴儿因意外事故死亡的只有10人左右,在全年因意外事故死亡(大多是因被褥捂住口鼻窒息而亡)的1 110名婴儿与因婴儿猝死综合征死亡的2 063名婴儿中只占极小的比例。这项研究表明,在同等条件下,托儿所的安全性优于家庭照料。不过,各项条件通常并不是同等的,而且各项条件的影响作用也不相同。市政府许可建立的托儿所的确漂亮整洁,而提供照料婴儿服务的家庭可能有一些不尽如人意的地方,但是前者离家的距离是后者的二倍,在这种情况下该如何选择呢?2010年,有79名婴儿死于交通事故。如果出于安全考虑,选择更漂亮的托儿所,那么,由于路途较远,孩子每年花在交通上的时间就会多出20%,以致托儿所的安全优势荡然无存。
1701024061
1701024062
显著性检验是一种科研工具,而所有的科研工具都有一定的精度。如果我们提高检验的敏感度(例如,增加研究对象的数量),就可以发现不太明显的影响因素。这是这种方法的长处所在,却也是我们容易犯错的地方。我们必须牢记一点:确切地讲,零假设可能是指永远都不正确的假设。在药效强劲的药物进入病人的血液后,很难相信这种介入对病人患食道癌、形成血栓或者产生口臭等的概率没有任何影响。我们身体的所有部分构成一个复杂的反馈环,相互间会产生影响与作用。我们每做一件事,都会增加或减少我们患癌症的可能性。从原则上讲,只要研究足够深入和细致,就能对它们一一加以甄别。但是,这些影响通常都微不足道,根本无须考虑。我们能检测出这些因素,并不意味着这些因素就一定非常重要。
1701024063
1701024064
如果我们能够回到过去,在人们开始接触显著性检验这个统计学术语时宣布,p值小于0.05的统计结果为“值得注意的统计结果”或者“可以检测到的统计结果”,而不是“重要的统计结果”,情况就会得到改观!这样一来,这个术语就只能告诉我们存在某种结果,而不会对该结果的重要性与作用大小妄加评论,从而更有助于实现这种研究方法的目的。但问题是,现在为时已晚,这个统计学术语已经得到认可而无法更改了。
1701024065
1701024066
篮球比赛中真的存在“手热效应”吗?
1701024067
1701024068
伯尔赫斯·弗雷德里克·斯金纳(Burrhus Frederic Skinner)是一位心理学家,堪称现代心理学界的杰出代表。斯金纳是行为主义心理学的领袖,他的锋芒令弗洛伊德的信徒们惴惴不安。在他的领导下,行为主义心理学足以与精神分析学分庭抗礼。行为主义只关注看得见和可以测量的行为,而不要求对无意识或者有意识的行为动机做出任何假设。在斯金纳看来,心理研究理论就是行为研究理论,因此,有心理学研究价值的项目根本不会关注思想或感情,而会关注通过强化方式实现的行为操控。
1701024069
1701024070
很多人可能不知道,斯金纳曾是一位不得志的小说家。在汉密尔顿学院求学时,斯金纳主修英语,但是他与化学教授、唯美主义者波西·桑德斯(Percy Saunders)交往甚密,桑德斯的家就像一个文艺沙龙。斯金纳喜欢埃兹拉·庞德(Ezra Pound)的诗、舒伯特(Schubert)的音乐,他还动笔写了一些诗,(例如,“夜里,他停了下来,喘着气/对着留在尘世的妻子喃喃低语/‘爱情让我心力交瘁!’”)并发表在学院的文艺杂志上,在青年学生中深受欢迎。大学毕业后,他参加了布雷德罗夫作家创作班,其间他创作了“一部独幕剧,剧中的江湖医生可以利用激素改变人们的性格”,他还把自己写的几部短篇小说寄给了诗人罗伯特·弗罗斯特(Robert Frost)。弗罗斯特在给斯金纳的信中称赞了他的这几部小说,并给出了一些建议:“作家必须具备的一项能力,是在创作时可以坚定地直接利用某些不负责任、几乎无法克服的个人偏见……我认为,每个人都心存偏见,都会花时间琢磨、感受这些偏见,为自己的说话与写作提供素材。但是,大多数人往往选择在作品中表现其他人的偏见,于是他们的创作生涯就此终结。”
1701024071
1701024072
1926年夏天,在受到弗罗斯特的这番鼓励之后,斯金纳搬进了父母在斯克兰顿的一间阁楼里,正式开始了写作生涯。不过,他发现,找到自己的偏见并不容易,即使找到了,也很难用文学的形式表现出来。因此,他在斯克兰顿的那段岁月里一无所获。在那间阁楼里,他写了几篇小说,还创作了一首关于工人领袖约翰·米切尔(John Mitchell)的十四行诗,但是大部分时间里他都忙着修舰船模型,用无线电接收从匹兹堡和纽约传过来的远程信号。当时,人们刚刚学会用无线电来消磨时间。
1701024073
1701024074
后来,斯金纳在谈及这段经历时说:“从事文学创作之后,所有事情都会导致我产生强烈的反应。创作失败是因为我找不到有价值的素材,但是我无法接受这个理由。我觉得,错不在我,而在于文学创作本身。”有时他甚至直言不讳地说:“文学创作就应该被废止。”
1701024075
1701024076
斯金纳经常阅读《日晷》(The Dial)这份文学杂志。在这份杂志上,他读到了伯特兰·罗素的哲学作品,通过罗素,他又接触到行为主义的第一个倡导者、伟大的心理学家约翰·华生(John Watson)的作品(随后不久,行为主义几乎成了斯金纳的代名词)。华生认为,科学家需要完成的唯一工作就是观察实验结果,而根本不需要对意识或灵魂提出各种假设。他有一句名言:“从来没有人在试管中触摸或者看到过灵魂。”这个无情的批驳令斯金纳为之折服,于是他怀着把这种含糊的、不真实的自我从行为科学研究中剔除出去的理想,来到哈佛大学攻读心理学硕士学位。
1701024077
1701024078
在一次实验中,一种自发的言语行为给他留下了深刻的印象。当一台机器不断地发出有节奏的背景音时,斯金纳发现自己正在跟随这个节拍无声地重复一句话:“你永远出不来,你永远出不来,你永远出不来。”这个过程就好像演讲,甚至有点儿像诗歌朗诵,但实际上是自言自语,说话者根本意识不到自己的这种行为。斯金纳一直对自己在文学创作上遭遇的失败耿耿于怀,而这个发现为他提供了反击的武器。他想,语言,甚至那些伟大诗人们使用的语言,是否有可能仅仅是另外一种行为,是在实验室里通过刺激手段训练而成并且可以操控的行为呢?
1701024079
1701024080
在大学期间,斯金纳模仿过莎士比亚的十四行诗。他利用彻底的行为主义的方式回顾了这段经历,并称“这段经历非常奇怪,符合格律、韵脚整齐的诗句信手拈来,令人无比兴奋”。作为明尼苏达大学一位年轻的心理学教授,斯金纳认为那些名言佳句并不是莎士比亚创作的,而是早已存在,只不过借他的笔粉墨登场而已。这样的评价在现在看来非常疯狂,但是在当时,连“细读”(close reading)这种主流文学评论形式也与斯金纳的评论一样带有华生心理学的痕迹,凸显出行为主义者对词语本身的喜好,而作者的意图却因为无法直接观察到而遭到忽视。
1701024081
1701024082
莎士比亚善于运用头韵修辞法(连续几个单词都以相同发音的字母开头),例如,“Full fathom fi ve thy father lies”。但是斯金纳认为,例证并不是科学的证明方法。莎士比亚用过头韵修辞法吗?如果用过,我们就可以用数学方法加以证明。斯金纳指出:“要证明某个地方采用了头韵修辞法,我们需要取一个大小适中的样品,对其中所有单词首字母发音的分布情况进行统计分析,分析结果才是可以利用的证据。”那么,该采取哪种统计分析方法呢?当然是显著性检验!在这种统计分析中,零假设为“莎士比亚根本没有注意单词首字母的发音情况,因此诗歌中某一个单词的首字母不会对该行诗中其他单词造成任何影响”。这项假设与临床试验非常相似,但是也有一个很大的不同:斯金纳的目的是颠覆文学,因此他希望零假设成立;而在测试某种药物的疗效时,生物医学研究人员则一心想推翻零假设,证明该药物有显著疗效。
1701024083
1701024084
在零假设前提下,如果同一行诗中多个单词的首字母发音相同,即使将该行诗中的单词打乱次序、随机排列,这些发音重复出现的频率也不会改变。斯金纳选取了100首十四行诗作为样本进行了统计分析,结果正好与零假设相符。也就是说,莎士比亚没能通过显著性检验。于是,斯金纳指出:
1701024085
1701024086
尽管十四行诗中看似使用了大量的头韵修辞法,但是没有显著性的证据证明这些诗歌的确运用了头韵修辞法,这值得我们关注。因此,莎士比亚的这些诗句不过是他的妙手偶得。
1701024087
1701024088
“看似大量”这样的说法绝对是强词夺理,它赤裸裸地表现了斯金纳希望为心理学营造的精神实质。弗洛伊德声称看清了之前是隐藏的、抑制的或者含混的东西,而斯金纳的目标正好相反——否认看上去一目了然的存在。
1701024089
1701024090
然而,斯金纳所使用的证明方法并不正确。显著性检验与望远镜一样,都是一种工具,但各种工具的作用并不相同。在观察火星时,如果我们使用的是专业级别的天文望远镜,我们就能看到火星的卫星;如果使用的是双筒望远镜,则无法看到卫星。但是,无论我们能否看到,卫星都存在!同样,莎士比亚诗中的头韵修辞法也必然存在。据文学史家的考证,头韵是当时普遍采用的修辞方法,几乎所有用英文写作的人都掌握了这种方法,并有意识地使用它。
1701024091
1701024092
斯金纳的观点是:莎士比亚没有大量使用头韵修辞法,因为显著性检验没有发现首字母发音重复出现的频率超过常态。但是,非得如此才能说明莎士比亚使用了头韵修辞法吗?诗歌中头韵修辞法的使用是把双刃剑,在某些地方可以实现预期效果,但如果滥用就会适得其反,因此在某些地方作者会有意识地避免使用头韵修辞法。诗人也许希望头韵修辞法的数量在总体上有所增加,但是即便如此,增加的数量也不能太多。在写十四行诗时,如果硬要塞一两个头韵修辞法进去,就会导致诗歌的韵律过于僵硬。莎士比亚的信徒、伊丽莎白时期的诗人乔治·加斯科因(George Gascoigne)曾经嘲讽过这种现象:“诗中使用同一个字母开头的单词,(如果使用得当)可以为诗歌增色,但是很多诗人不加节制地滥用,导致这种手法变得稀松平常——Crambe bis positum mors est。”
1701024093
1701024094
最后这句拉丁语的意思是“大白菜吃多了也会要人命”。虽然在莎士比亚的作品中这种修辞方法常常出现,但他从来不会不加节制地把这种修辞方法变成“大白菜”。因此,斯金纳那些粗略的检验手段是不可能有所发现的。
1701024095
1701024096
在统计研究中,如果无法检验到预期的效果,则被称作“统计功效不足”。就像用双筒望远镜观测恒星一样,无论这颗恒星的周围是否有卫星,观测结果都相同,这就是在做无用功。因此,我们在需要使用天文望远镜时,绝不会使用双筒望远镜。在研究英国节育工作所面临的恐慌问题时,统计功效低下还不是最严重的问题。在检验节育效果时,高效的统计研究可能会把我们的目光引向其实并不重要的细微效果,而功效不足的统计研究却会导致我们忽略某个细微效果。
1701024097
1701024098
我们以密歇根大学男子篮球队的后卫斯派克·阿布瑞克特(Spike Albrecht)为例。2013年美国大学生体育协会(NCAA)篮球决赛开始时,没有人预料到这位身高约1.8米,在赛季的大部分时间里都担任替补队员的一年级新生,竟然会在密歇根大学狼獾队与路易维尔大学篮球队的比赛中大放异彩。在比赛的上半场,阿布瑞克特在10分钟内连中5球,其中4个为三分球,带领密歇根队以10分的优势领先于被普遍看好的对手。用球迷的话来说,阿布瑞克特的手“热得发烫”,无论距离篮筐有多远、防守多么凶悍,他照样能投篮得分。
1701024099
1701024100
不过,人们认为这样的情况是不应该发生的。1985年,托马斯·基洛维奇(Thomas Gilovich)、罗伯特·瓦朗(Robert Vallone)与阿莫斯·特沃斯基(Amos Tversky)——简称“GVT”——完成了一项研究,并发表了一篇名噪一时的认知心理学论文。对于篮球迷而言,这项研究相当于莎士比亚拥趸眼中的斯金纳研究。GVT收集了1980~1981赛季费城76人队全部48场主场比赛的所有投篮记录,然后进行了统计分析。如果所有球员都有“手冷”“手热”的时候,那么按照预期,一位球员在投中一球之后,下一次投篮命中的可能性会更高。GVT就这个观点在NBA球迷中做了一次调查,结果发现大多数球迷表示同意。有9/10的球迷认为,球员在连续投中两三个球之后,下一次投篮命中的可能性更大。
1701024101
[
上一页 ]
[ :1.701024052e+09 ]
[
下一页 ]