打字猴:1.701024705e+09
1701024705 单纯地依靠零假设显著性检验的做法,严重违背了贝叶斯推理的精神。严格地讲,这种做法会让人认为抗癌药物与巨石阵塑料模型有相同的疗效。费舍尔的统计学观会不会因此受到打击呢?事实恰好相反。费舍尔说过:“科研人员不会设一个固定的显著性临界值,然后年复一年,无论情况如何变化,都依据这条红线去推翻各种假设。相反,他们会在证据的启示下,结合自己的想法,认真考虑每一个具体案例。”这句话的意思是,科学推理不能(至少不应该)过于机械,推理时必须随时考虑先前的想法与置信度。
1701024706
1701024707 我并不是说费舍尔完全遵循了贝叶斯的统计学思想。在我们看来,费舍尔的这番话涵盖了一度不为人所接受,但如今已成为主流的一系列统计学行为与思想,其中包括贝叶斯定理。但是,费舍尔并不是主张将先前的置信度与新证据简单地放到一起考虑。贝叶斯定理对推理方法产生了广泛的影响,例如教会机器根据人们输入的大量数据来学习,但这些方法并不适用于回答是或否的问题。对于是或否的问题,人们常常借助费舍尔的方法做出判断。事实上,信奉贝叶斯定理的统计学家通常对显著性检验不屑一顾,他们对“该新药是否有疗效”之类的问题不感兴趣,他们更关注如何建立一个预测模型,以便更准确地判断该药物的不同剂量在针对不同人群时可以取得什么样的疗效。即便真的用到假设,他们对假设(例如,“新药的疗效胜过现有药物”)是否正确这个问题的关注度也没有那么高;而费舍尔则不同,在他看来,只有在随机过程正在进行的情况下,才可以使用概率这种表达方式。
1701024708
1701024709 说到这里,我们已经站在了哲学海洋的岸边了。对于这些哲学难题,本书会点到为止。
1701024710
1701024711 既然我们把贝叶斯定理称作定理,就表明它是不容置疑的,并且我们已经使用数学证据完成了相关证明。这种认识既对也不对,它涉及一个难题:“概率”
1701024712
1701024713 到底指什么?如果我们说红色论正确的概率为5%,我们可能是指,在全世界范围内其实有大量轮盘赌的转轮,其中正好有1/20的转轮偏向红色区域,小球停在红色区域的概率为3/5。而且,我们看到的任何轮盘赌的转轮,都是从这些转轮中随机选取的。如果是这样,贝叶斯定理就与上一章讨论的大数定理一样,都是千真万确的。大数定理认为,在本例所设定的条件下,在得出RRRRR这个结果的轮盘赌的转轮中,有12%的转轮是偏向红色区域的。
1701024714
1701024715 当认为红色论正确的概率为5%时,我们想说明的不是偏向红色区域的轮盘赌转轮在全球范围内的分布情况(这个问题我们怎么可能搞清楚呢),而是我们的一种心理状态。5%是“眼前这个转轮偏向红色区域”这种说法的置信度。
1701024716
1701024717 顺便说一句,费舍尔就是从这里开始与其他人分道扬镳的。约翰·梅纳德·凯恩斯(John Maynard Keynes)在《概率论》(Treatise on Probability)中指出,概率“测量的是人们结合已知证据后赋予命题的‘合理置信度’”。费舍尔对这个观点提出了严厉的批评,他的最后几句话很好地概括了他的看法:“如果美国数学系的学生认为凯恩斯先生在该书最后一章中的观点是权威观点并加以接受,他们就会在应用数学最有前景的分支领域中误入歧途,有的人会讨厌这些研究,大多数人则会变得愚昧无知。”
1701024718
1701024719 对于那些愿意接受概率就是置信度这种观点的人而言,贝叶斯定理不仅可以被看作一个数学方程式,还是一种偏重于数值的规则,它告诉我们如何结合新的观察结果修正我们赋予事物的置信度。当然,我们可以选择是否遵从这个规则。贝叶斯定理采用了一种新颖且更具一般性的形式,自然会引发更激烈的争议。坚信贝叶斯定理的人认为,对于所有事物,我们至少应该在有限的认知范围内根据严格的贝氏计算法来确定置信度,而其他人则认为贝氏规则更近似于一种宽松的定性指导原则。
1701024720
1701024721 出现RBRRB与RRRRR这两个结果的可能性都非常小,而且概率相同,但是在人们看来,前者是随机结果,后者则不是,这是为什么呢?贝叶斯的统计学观足以解释其原因。当看到RRRRR这个结果时,我们就会更加相信一个理论(即转轮做过手脚,小球会停在红色区域),对于这个理论,我们已经赋予了某个先验概率。但是,如果出现的结果是RBRRB呢?我们可以假设有这样一个人:
1701024722
1701024723 对于轮盘赌的转轮,他通常不带任何偏见,对于“转轮中藏有可以产生RBRRB这个结果的鲁布·戈德堡机械装置”这种想法,他会赋予一个中庸的概率。为什么不可以这样想呢?如果这样的一个人看到RBRRB这个结果,他会更加坚定自己的想法。
1701024724
1701024725 但是,在真实世界中,当轮盘赌的转轮真的产生RBRRB这个结果时,人们是不会这样想的。我们的有些想法合乎逻辑但非常荒谬,对于这样的想法,我们不会全盘接受。先验概率不是一视同仁,而是有所取舍的。在心理上,有的想法会得到明显的重视,而对于RBRRB这一类结果,我们赋予它们的先验概率几乎接近于零。那么,什么样的想法会受到我们的青睐呢?相较于复杂想法以及以完全陌生的现象为基础的想法,我们往往更喜欢简单的想法和那些通过类比我们所熟知的事物而产生的想法。这种喜好似乎是一种不公平的偏见,但是,如果没有任何偏见,我们就有可能整天都处于震惊的状态。理查德·费曼(Richard Feynman)有一段非常有名的话,描述的正是这种心理状态。
1701024726
1701024727 大家知道吗,今晚我遇到了一件非常奇怪的事。就在我来这儿的路上,当我从停车场经过时,一件令人难以置信的事情发生了,我看到一辆车的车牌号为ARW357。大家想一想,我们州有好几百万个车牌号,今天晚上我看到这个车牌号的概率是多少?这太让人吃惊了!
1701024728
1701024729 如果大家服用过美国最流行的某种打法律“擦边球”的精神药物,就会知道一视同仁的先验概率会给我们带来什么样的感觉。服用了那种药物之后,所有刺激都会让我们觉得意义深刻,无论这种刺激是多么平常。每种体验都会激起我们的兴趣,让我们欲罢不能。这样的精神状态非常有趣,但无助于我们做出正确的推理。
1701024730
1701024731 贝叶斯的观点可以解释费曼当时并没有真的感到吃惊的原因:对于“某种宇宙力量驱使他看到ARW357这个车牌号”的假设,他赋予了一个非常小的先验概率。他的观点还可以解释为什么小球连续5次停在红色区域会让人们觉得其“随机程度小于”RBRRB这个结果:因为前者会触发某个想法(即红色论),所以我们赋予这个想法的先验概率并不是非常小,但是后者没有这种作用。而且,末位数为0的数字的随机程度似乎小于末位数是7的数字,原因是前者会使我们产生这样的想法:我们看到的这个数字不是精确的统计数字,而是粗略估计得出的结果。
1701024732
1701024733 贝叶斯推理框架还可以帮助我们解决前文中遇到的难题。当彩票游戏连续两次开出“4、21、23、34、39”这个中奖号码时,我们感到非常吃惊,并且会心存疑虑。但是,如果某一天开出的中奖号码为“4、21、23、34、39”,另一天开出的中奖号码为“16、17、18、22、39”,对此我们丝毫不会觉得奇怪。这两种情况出现的可能性都很小,但为什么我们的反应却大相径庭呢?我们的思想深处隐藏着某种想法,认为很有可能出于某种神秘的原因,彩票游戏才会在很短的时间内两次开出同一组中奖号码。我们可能会认为彩票游戏的主管部门从中做了手脚,或者某种青睐同步性的宇宙力量发生了作用,但是这些都不重要。我们真诚地认为,同一组中奖号码重复出现的先验概率只有1/100 000。但是,与我们赋予“4、21、23、34、39”和“16、17、18、22、39”这两组中奖号码的先验概率相比,1/100 000仍然要大得多。认为不同的中奖号码是作弊产物的想法十分疯狂,而我们没有喝醉酒,头脑非常清醒,因此,我们不会把它当回事儿。
1701024734
1701024735 即使我们真的在一定程度上相信某个疯狂的想法,也无须担心。当我们得到的证据与这个想法不一致时,我们赋予这个疯狂想法的置信度就会下降,直到与其他人差不多。除非这种疯狂的想法经过精心的设计可以躲过这个筛选程序,阴谋论就是这样起作用的。
1701024736
1701024737 假设你深信的一位朋友说,波士顿马拉松爆炸案是联邦政府监守自盗的产物,目的是让更多公众支持美国国家安全局窃听个人电话(我随便说说而已,大家千万别当真)。我们把这个定义为T理论。由于你信任这位朋友,因此你一开始就为这个理论赋予了一个较大的先验概率,比如说0.1。但是,随后我们获取了其他信息,诸如,警察已经锁定嫌犯的位置,侥幸活命的嫌犯供认不讳等。如果T为真,这些信息为真的可能性就会非常小,因此,每一条信息都会使T的置信度逐渐降低,直到我们不再相信它。
1701024738
1701024739 因此,朋友不会直接把T理论告诉我们,而会先告诉我们U理论,即政府与媒体都参与了这个阴谋,比如,报纸与有线电视网散播了爆炸案是穆斯林极端分子制造的假消息。一开始时,T+U结合体的先验概率更小。从本质上讲,这个结合体比T更令人难以置信,因为它要求我们同时相信T和U理论。但是,随着证据逐渐增多,这些证据往往只能削弱T的置信度,而T+U结合体却不受任何影响。[4]焦哈尔·察尔纳耶夫(Dzhokar Tsarhaev)招供了?对啊,我们本来就猜到联邦法院会这么说,因此美国司法部肯定参与了这次事件!U理论就像T理论的保护层,使新证据无法触及T,更不能推翻T。荒诞不经但却非常成功的理论大多有这种共性,这些理论有厚厚的保护层,这些保护层又与很多可观察到的结果并不矛盾,因此很难被打破。在信息的生态系统中,它们就是有多种耐药性的“大肠杆菌”。
1701024740
1701024741 戴帽子的猫与学校里最不讲卫生的人
1701024742
1701024743 大学时,我的一个朋友在新学年开始的时候,总想着向大一新生推销T恤,赚些零花钱。当时,人们可以从丝网印刷店以每件4美元的价格大量购买T恤,并以每件10美元的价格在校园里出售。在20世纪90年代,模仿《戴帽子的猫》(The Cat in the Hat)中的那只猫,戴着帽子参加派对成为一种流行时尚。我的朋友花了800美元,在200件T恤上印刷了戴帽子的猫喝啤酒的图案,那批T恤很受欢迎。
1701024744
1701024745 朋友只是具备企业家的头脑,但还算不上一位优秀的企业家。其实,应该说他不是很勤快。在卖了80件T恤把最初的投资收回之后,他就不愿意继续在校园里兜售了,剩下的T恤被装进箱子塞到了床底下。
1701024746
1701024747 一周之后,到了该洗衣服的日子了。但我的这位朋友很懒,根本不想洗衣服。这时候,他想起床底下还有一箱干净的、印有戴帽子的猫喝啤酒图案的新T恤。于是,他拿出一件穿在身上。
1701024748
1701024749 第二天,他又穿上一件新T恤。
1701024750
1701024751 就这样,日子一天天地过去了。
1701024752
1701024753 周围的人都认为他是学校里最不讲卫生的人,因为他总穿着那件T恤。实际上,他是学校里最讲卫生的人,因为他每天都会穿一件刚从床底下拿出来的干净的新T恤。这种状况真令人啼笑皆非。
1701024754
[ 上一页 ]  [ :1.701024705e+09 ]  [ 下一页 ]