打字猴:1.701024023e+09
1701024023
1701024024 阿布斯诺特提出的这个论据受到了神学研究名流的普遍赞誉,并被他们反复引用。但是,其他数学家却迅速指出他的推理过程存在某些缺陷,其中最主要的问题是他的零假设不合理,即婴儿性别是随机确定的,生男孩与生女孩的概率相同。这两个概率一定是相同的吗?尼古拉斯·伯努利(Nicholas Bernoulli)提出了一个不同的零假设:婴儿性别是由偶然性决定的,是男孩的概率为18/35,是女孩的概率为17/35。与阿布斯诺特的零假设一样,伯努利的零假设也否认了神的存在,但是与统计数据极为吻合。如果我们将一枚硬币抛了82次,结果全为正面朝上,那么我们应该认为“这枚硬币有问题”,而不是“上帝青睐硬币的正面”。[5]
1701024025
1701024026 尽管阿布斯诺特的论证没有得到广泛认可,但是其中的精神却得以传承。阿布斯诺特不仅是圣经密码学术研究之父,而且对神学研究者影响极深。时至今日,神学研究者仍然认为数学研究证明上帝必然存在,理由是没有神的世界绝不可能是现在这样。
1701024027
1701024028 不过,显著性检验的对象不应仅仅是神学研究给出的各种辩词。从某种意义上讲,查尔斯·达尔文(Charles Darwin)——在神学研究者眼中,他就是一个粗野、邪恶的无神论者——在论证自己的研究成果时,也采用了基本相同的方式。
1701024029
1701024030 自然选择理论对上述几大类事实的解释非常完美,几乎可以肯定,错误的理论是不可能拥有如此令人满意的效果的。最近,有人质疑这是一种危险的论证方法,但是人们评判生活中一些常见事件时都会使用这种方法,而且伟大的自然哲学家们也经常采用这种方法。
1701024031
1701024032 换句话说,如果自然选择理论是错误的,那么我们面前的生物世界几乎不可能与该理论的预测完全一致。
1701024033
1701024034 费舍尔的贡献是把显著性检验变成了一种形式主义的手段,借助这个系统性的方法可以客观地分析实验结果的显著性(或非显著性)。近100年来,显著性检验一直是评估科研结果的标准方法。有一本权威教材把这个方法称作“心理学研究的支柱”,我们在判断实验成功与否时也以此为标准。我们所看到的医学、心理学或经济调查的研究结果,很有可能都经过了显著性检验。
1701024035
1701024036 但是,达尔文从“危险的论证方法”这个说法中看出人们心存疑虑,而且这种担忧从未消失。几乎自成为标准方法之日起,就一直有人认为这个方法是一个天大的错误。早在1966年,心理学家戴维·巴肯(David Bakan)就撰文讨论过这个“心理学危机”,巴肯认为这是“统计学理论的危机”。
1701024037
1701024038 显著性检验并不能告诉我们该显著性引发的心理现象具有何种特征……它的应用已经造成了大量问题……就像那个孩子大声说出皇帝其实什么也没穿一样,我们也需要“大声疾呼”,揭穿它的真相。
1701024039
1701024040 近50年过去了,尽管越来越多的孩子四处奔走,传播皇帝赤身裸体的消息,但是这位皇帝仍然一丝不挂地待在他的办公室里,继续寻欢作乐。
1701024041
1701024042 并不显著的显著性
1701024043
1701024044 显著性到底有什么问题呢?首先,这个名称并不恰当。数学与文字之间的关系颇为奇怪。数学研究论文的主要表述工具不是数字与符号,而是文字,这种现象有时会令外行感到惊讶。我们提到的数学对象往往是《韦氏词典》编纂者们漫不经心列出的一个个词条。新事物需要新词汇,面对这种情况,通常有两种解决办法。第一种做法是,我们另起炉灶创造新词。例如,cohomology(上同调)、syzygies(对点)、monodromy(单值)等,但这些新词会让我们的研究看上去令人生畏。与这种方法相比,第二种做法更常见。在我们察觉拟描述的数学对象与真实世界中的某个事物之间存在某种相似性之后,可以基于这种相似性使用已有词语来指代这些数学对象。例如,“group”(群),在数学家眼中确实指代一群事物,但是数学领域的“群”非常特别,例如整数群或者几何图形的对称操作群。数学上的群与“OPEC”(石油输出国组织)、“ABBA”(瑞典乐队组合)这类群体不同,它是指具有某种属性的事物组合:群中任意两个事物可以组合变成第三个事物。例如,两个数字可以相加,两个对称操作可以相继执行。[6]此外,“scheme”(模式)、“bundle”(丛)、“ring”(环)与“stalk”(茎)等数学对象也与这些词的本义相差甚远。有时我们选用的数学对象的名称具有田园生活的特点,例如,现代代数几何学中频繁使用的“fi eld”(场)、“sheaf”(层)、“kernel”(核)与“stalk”等。还有的时候,数学语言看上去似乎平淡无奇,但却令人十分头疼,例如,某个计算符号会“kill”(中止)某个进程,而“annihilate”(零化)这个词则更加时髦。有一次,一位同事在机场使用了数学领域中一个非常普通的词,说总有一天有必要把飞机“blow up”[7],它让我感到胆战心惊。
1701024045
1701024046 “Signifi cance”这个词也一样,在普通语言环境中,它是指“重要的”或“有意义的”。但是,科学家进行的显著性检验,目的并不是检测重要性。我们在测试新药的疗效时,零假设是“该药没有任何疗效”,因此,要推翻该零假设,我们仅需要证明该药物有疗效。但是,它的疗效可能非常小,如果按照非数学专业人士对疗效“显著性”的理解,那么这种药物可能会被评估为没有任何疗效。
1701024047
1701024048 “signifi cance”一词的两种含义会带来一系列后果,而不仅仅是让科研论文晦涩难懂。1995年10月18日,英国药品安全委员会(CSM)向20万名医生与保健人员发出了一封“致全体医生”的公开信,对某个品牌的第三代口服避孕药发出警告。信中称:“新的证据表明,在服用某些类型避孕药的人群中,患静脉血栓的风险增加了一倍。”静脉血栓可不能等闲视之,因为它会妨碍血液在静脉中的流动。如果血块摆脱束缚,就会随血液进入肺部形成肺栓塞,夺走人的生命。
1701024049
1701024050 这封“致全体医生”公开信随后立即安慰读者,称口服避孕药对大多数女性来说是安全的,除非医生建议停药,否则可继续服用。但是,由于标题中使用了“致命的药丸”这样的字眼,因此这些内容中的细节很容易被人忽视。10月19日,美联社在新闻报道的开头就指出:“英国政府在星期四发出警告,称150万名英国妇女服用的新型避孕药物可能会引发血栓……英国政府曾考虑召回这些药物,但最终没有形成决议,部分原因是某些妇女无法接受其他避孕药。”
1701024051
1701024052 这则报道自然引起了英国公众的强烈反应。一位全科医师发现,女性病人看了这则报道之后,其中有12%的人立刻停止服用这种避孕药,转而服用不会引发血栓的其他避孕药。但是,一旦中止服用避孕药,就会对避孕效果产生影响,使怀孕人数增加。(大家不会以为我接下来会告诉你们这件事引发了禁欲浪潮吧?)此前,英国的生育率连续多年走低,但在1996年却增加了好几个百分点,英格兰与威尔士的怀孕人数比前一年增加了2.6万名。这么多的人意外怀孕,导致堕胎人数激增,1996年的堕胎人数比1995年增加了1.36万名。
1701024053
1701024054 血块在血液循环系统中横冲直撞,有可能会严重影响人的身体健康。与之相比,堕胎似乎微不足道。的确,我们可以想象有多少妇女因为CSM的警告而规避了肺栓塞致死的风险!
1701024055
1701024056 但是,到底有多少女性从中获益了呢?我们无法知道确切的数字。不过,一位支持CSM发布警告的科学家称,因为警告而逃过一劫的总人数“有可能仅为一人”。第三代避孕药的风险具有统计学显著性,但从医疗保健的角度看则没有那么明显的显著性。
1701024057
1701024058 但是,新闻报道加剧了人们的恐慌。CSM的信中指出了“风险率”(risk ratio):第三代避孕药会使妇女患血栓的风险增加一倍。如果不知道肺栓塞其实极少发生,我们就会以为这种情况十分危险。在服用第一代与第二代避孕药的育龄妇女中,每7 000人中可能有一人会患血栓。服用新型避孕药的确会使患血栓的风险加倍,也就是2/7 000的概率,但是这种可能性仍然非常小。“极小数的二倍仍然是一个极小数”这个数学事实已经得到了证明,某个数的二倍会产生什么样的影响,取决于这个数本身的大小!在“涂鸦拼字”游戏中,在双倍积分时拼出“ZYMURGY”(酿造学)这种7个字母的单词就是一次成功,但如果拼出来的是“NOSE”(鼻子)这种4个字母的单词,就错失良机了。
1701024059
1701024060 风险率这个概念,比1/7 000这样一个极小概率更容易理解。但是,用风险率来说明小概率事件时很容易误导人。纽约市立大学的几名社会学家完成的一项研究发现,接受家庭照料或由保姆照看的婴幼儿,其死亡率是上托儿所或幼儿园婴幼儿死亡率的7倍。大家先不要忙着解雇保姆,而应该考虑一下:在当今这个时代,美国很少发生婴幼儿死亡事件,即使真有不幸夭折的,也不是因为照料方面的过错。接受家庭照料的婴儿,其年死亡率为1.6/100 000,比托儿所或幼儿园的0.23/100 000高。但是,这两个概率都非常接近于零。纽约市立大学的这项研究指出,2010年由家庭照料的美国婴儿因意外事故死亡的只有10人左右,在全年因意外事故死亡(大多是因被褥捂住口鼻窒息而亡)的1 110名婴儿与因婴儿猝死综合征死亡的2 063名婴儿中只占极小的比例。这项研究表明,在同等条件下,托儿所的安全性优于家庭照料。不过,各项条件通常并不是同等的,而且各项条件的影响作用也不相同。市政府许可建立的托儿所的确漂亮整洁,而提供照料婴儿服务的家庭可能有一些不尽如人意的地方,但是前者离家的距离是后者的二倍,在这种情况下该如何选择呢?2010年,有79名婴儿死于交通事故。如果出于安全考虑,选择更漂亮的托儿所,那么,由于路途较远,孩子每年花在交通上的时间就会多出20%,以致托儿所的安全优势荡然无存。
1701024061
1701024062 显著性检验是一种科研工具,而所有的科研工具都有一定的精度。如果我们提高检验的敏感度(例如,增加研究对象的数量),就可以发现不太明显的影响因素。这是这种方法的长处所在,却也是我们容易犯错的地方。我们必须牢记一点:确切地讲,零假设可能是指永远都不正确的假设。在药效强劲的药物进入病人的血液后,很难相信这种介入对病人患食道癌、形成血栓或者产生口臭等的概率没有任何影响。我们身体的所有部分构成一个复杂的反馈环,相互间会产生影响与作用。我们每做一件事,都会增加或减少我们患癌症的可能性。从原则上讲,只要研究足够深入和细致,就能对它们一一加以甄别。但是,这些影响通常都微不足道,根本无须考虑。我们能检测出这些因素,并不意味着这些因素就一定非常重要。
1701024063
1701024064 如果我们能够回到过去,在人们开始接触显著性检验这个统计学术语时宣布,p值小于0.05的统计结果为“值得注意的统计结果”或者“可以检测到的统计结果”,而不是“重要的统计结果”,情况就会得到改观!这样一来,这个术语就只能告诉我们存在某种结果,而不会对该结果的重要性与作用大小妄加评论,从而更有助于实现这种研究方法的目的。但问题是,现在为时已晚,这个统计学术语已经得到认可而无法更改了。
1701024065
1701024066 篮球比赛中真的存在“手热效应”吗?
1701024067
1701024068 伯尔赫斯·弗雷德里克·斯金纳(Burrhus Frederic Skinner)是一位心理学家,堪称现代心理学界的杰出代表。斯金纳是行为主义心理学的领袖,他的锋芒令弗洛伊德的信徒们惴惴不安。在他的领导下,行为主义心理学足以与精神分析学分庭抗礼。行为主义只关注看得见和可以测量的行为,而不要求对无意识或者有意识的行为动机做出任何假设。在斯金纳看来,心理研究理论就是行为研究理论,因此,有心理学研究价值的项目根本不会关注思想或感情,而会关注通过强化方式实现的行为操控。
1701024069
1701024070 很多人可能不知道,斯金纳曾是一位不得志的小说家。在汉密尔顿学院求学时,斯金纳主修英语,但是他与化学教授、唯美主义者波西·桑德斯(Percy Saunders)交往甚密,桑德斯的家就像一个文艺沙龙。斯金纳喜欢埃兹拉·庞德(Ezra Pound)的诗、舒伯特(Schubert)的音乐,他还动笔写了一些诗,(例如,“夜里,他停了下来,喘着气/对着留在尘世的妻子喃喃低语/‘爱情让我心力交瘁!’”)并发表在学院的文艺杂志上,在青年学生中深受欢迎。大学毕业后,他参加了布雷德罗夫作家创作班,其间他创作了“一部独幕剧,剧中的江湖医生可以利用激素改变人们的性格”,他还把自己写的几部短篇小说寄给了诗人罗伯特·弗罗斯特(Robert Frost)。弗罗斯特在给斯金纳的信中称赞了他的这几部小说,并给出了一些建议:“作家必须具备的一项能力,是在创作时可以坚定地直接利用某些不负责任、几乎无法克服的个人偏见……我认为,每个人都心存偏见,都会花时间琢磨、感受这些偏见,为自己的说话与写作提供素材。但是,大多数人往往选择在作品中表现其他人的偏见,于是他们的创作生涯就此终结。”
1701024071
1701024072 1926年夏天,在受到弗罗斯特的这番鼓励之后,斯金纳搬进了父母在斯克兰顿的一间阁楼里,正式开始了写作生涯。不过,他发现,找到自己的偏见并不容易,即使找到了,也很难用文学的形式表现出来。因此,他在斯克兰顿的那段岁月里一无所获。在那间阁楼里,他写了几篇小说,还创作了一首关于工人领袖约翰·米切尔(John Mitchell)的十四行诗,但是大部分时间里他都忙着修舰船模型,用无线电接收从匹兹堡和纽约传过来的远程信号。当时,人们刚刚学会用无线电来消磨时间。
[ 上一页 ]  [ :1.701024023e+09 ]  [ 下一页 ]