1701024684
1701024685
由此可见,红色论的置信度增加了一倍多,而黑色论的置信度几乎消失殆尽。置信度的这种变化是十分恰当的,小球连续5次停在红色区域,我们对转轮受到人为操纵的怀疑当然会增加。
1701024686
1701024687
上述“用0.032 5除所有数字”的步骤似乎有使用特殊手段的嫌疑,事实上,这个步骤没有什么问题。如果我们的直觉无法立即接受这个做法,我们还有另一种讨人喜欢的办法。假设有1万个轮盘赌转轮,分别置于1万个房间之中,每个转轮由一个人操作。你也是操作者之一,但你不知道自己操作的是哪一个转轮,也不了解该转轮的真实属性。这种情况可以通过以下方式建模:假设在这1万个转轮中,有500个转轮偏向黑色区域,有500个偏向红色区域,还有9 000个是公平的。
1701024688
1701024689
依据上述概率进行计算,你可以预测出大约有281个公平的转轮、39个偏向红色区域的转轮、5个偏向黑色区域的转轮会得到RRRRR这一结果。因此,当你得到RRRRR的结果时,你仍然不知道自己在哪个房间中,但是你已经大幅缩小了范围:你所在的房间应该是小球连续5次停在红色区域的那325个房间中的一个。在所有这些房间中,有281间(约占86.5%)中是公平的转轮,有39间(约占12%)中是偏向红色区域的转轮,只有5间(约占1.5%)中是偏向黑色区域的转轮。
1701024690
1701024691
停在红色区域的球越多,你就会越倾向于红色论(同时黑色论的置信度会降低)。如果你连续10次(而不是5次)看到小球停在红色区域,通过类似的计算,你会将红色论正确的概率提升至25%。
1701024692
1701024693
上述计算步骤的目的是向我们展示,在连续5次看到小球停在红色区域之后,公平论、红色论、黑色论的置信度的变化情况,也就是所谓的“后验概率”
1701024694
1701024695
(posterior probability)。先验概率描述的是看到相关证据之前的置信度,而后验概率描述的是看到相关证据之后的置信度。我们所做的工作叫作“贝叶斯推理”(Bayesian inference),因为由先验概率到后验概率的中间桥梁是一个叫作“贝叶斯定理”(Bayes’s Theorem)的概率公式。该定理的代数表达式非常简单,我随时可以写给大家看,但在这里就免了。这是因为,如果我们习惯于机械地应用公式,而不考虑周围的环境,有时我们就很难理解眼前的形势。在这里,我们需要知道的已经全部包括在前文的方框图中了。[3]
1701024696
1701024697
后验概率不仅受到所发现的证据的影响,还会受到先验概率的影响。如果某人是怀疑论中坚分子,他会在一开始时就受到先验概率的影响,认为黑色论、公平论、红色论正确的概率都是1/3。但在连续5次看到小球停在红色区域之后,他又会受到后验概率的影响,认为红色论正确的概率为65%。对于一个信念坚定的人来说,如果一开始时他就认为红色论正确的概率仅为1%,那么,即使连续5次看到小球停在红色区域,他也会认为红色论正确的概率仅为2.5%。
1701024698
1701024699
在贝叶斯推理的框架中,人们在看到证据后,某种理论的置信度不仅取决于证据的内容,还取决于一开始时的置信度。
1701024700
1701024701
这个特点似乎会引起麻烦,科学不应该是客观的吗?我们可能以为,理论的置信度仅仅取决于证据,而不是我们一开始时的偏见。如果实验证据表明某种药物的改进型产品减缓了某些癌症的生长速度,而且这些证据具有统计学显著性,我们很可能就会相信这种新药真的有效。但是,如果我们让病人置身于巨石阵的塑料模型中,并且取得了同样的疗效,我们会不会心有不甘地承认,这些远古时期形成的巨石阵真的能抑制人体中肿瘤的生长呢?我们可能不会这样想,因为这个想法太疯狂了。我们更有可能认为,也许是因为巨石阵运气好。对于这两种情况,我们有多种先验概率,结果,我们在解释证据时却采用了不同的先验概率,尽管证据是一样的。
1701024702
1701024703
脸谱网筛选恐怖分子的算法以及我们对邻居是否是恐怖分子的判断,也是这种情况。邻居的名字出现在脸谱网的黑名单上,并不能证明他就是恐怖分子嫌疑人。大多数人都不是恐怖分子,因此该假设的先验概率应该非常小,在这种情况下,即使找到相关证据,后验概率仍然非常小,所以我们不用担心(至少不应该担心)。
1701024704
1701024705
单纯地依靠零假设显著性检验的做法,严重违背了贝叶斯推理的精神。严格地讲,这种做法会让人认为抗癌药物与巨石阵塑料模型有相同的疗效。费舍尔的统计学观会不会因此受到打击呢?事实恰好相反。费舍尔说过:“科研人员不会设一个固定的显著性临界值,然后年复一年,无论情况如何变化,都依据这条红线去推翻各种假设。相反,他们会在证据的启示下,结合自己的想法,认真考虑每一个具体案例。”这句话的意思是,科学推理不能(至少不应该)过于机械,推理时必须随时考虑先前的想法与置信度。
1701024706
1701024707
我并不是说费舍尔完全遵循了贝叶斯的统计学思想。在我们看来,费舍尔的这番话涵盖了一度不为人所接受,但如今已成为主流的一系列统计学行为与思想,其中包括贝叶斯定理。但是,费舍尔并不是主张将先前的置信度与新证据简单地放到一起考虑。贝叶斯定理对推理方法产生了广泛的影响,例如教会机器根据人们输入的大量数据来学习,但这些方法并不适用于回答是或否的问题。对于是或否的问题,人们常常借助费舍尔的方法做出判断。事实上,信奉贝叶斯定理的统计学家通常对显著性检验不屑一顾,他们对“该新药是否有疗效”之类的问题不感兴趣,他们更关注如何建立一个预测模型,以便更准确地判断该药物的不同剂量在针对不同人群时可以取得什么样的疗效。即便真的用到假设,他们对假设(例如,“新药的疗效胜过现有药物”)是否正确这个问题的关注度也没有那么高;而费舍尔则不同,在他看来,只有在随机过程正在进行的情况下,才可以使用概率这种表达方式。
1701024708
1701024709
说到这里,我们已经站在了哲学海洋的岸边了。对于这些哲学难题,本书会点到为止。
1701024710
1701024711
既然我们把贝叶斯定理称作定理,就表明它是不容置疑的,并且我们已经使用数学证据完成了相关证明。这种认识既对也不对,它涉及一个难题:“概率”
1701024712
1701024713
到底指什么?如果我们说红色论正确的概率为5%,我们可能是指,在全世界范围内其实有大量轮盘赌的转轮,其中正好有1/20的转轮偏向红色区域,小球停在红色区域的概率为3/5。而且,我们看到的任何轮盘赌的转轮,都是从这些转轮中随机选取的。如果是这样,贝叶斯定理就与上一章讨论的大数定理一样,都是千真万确的。大数定理认为,在本例所设定的条件下,在得出RRRRR这个结果的轮盘赌的转轮中,有12%的转轮是偏向红色区域的。
1701024714
1701024715
当认为红色论正确的概率为5%时,我们想说明的不是偏向红色区域的轮盘赌转轮在全球范围内的分布情况(这个问题我们怎么可能搞清楚呢),而是我们的一种心理状态。5%是“眼前这个转轮偏向红色区域”这种说法的置信度。
1701024716
1701024717
顺便说一句,费舍尔就是从这里开始与其他人分道扬镳的。约翰·梅纳德·凯恩斯(John Maynard Keynes)在《概率论》(Treatise on Probability)中指出,概率“测量的是人们结合已知证据后赋予命题的‘合理置信度’”。费舍尔对这个观点提出了严厉的批评,他的最后几句话很好地概括了他的看法:“如果美国数学系的学生认为凯恩斯先生在该书最后一章中的观点是权威观点并加以接受,他们就会在应用数学最有前景的分支领域中误入歧途,有的人会讨厌这些研究,大多数人则会变得愚昧无知。”
1701024718
1701024719
对于那些愿意接受概率就是置信度这种观点的人而言,贝叶斯定理不仅可以被看作一个数学方程式,还是一种偏重于数值的规则,它告诉我们如何结合新的观察结果修正我们赋予事物的置信度。当然,我们可以选择是否遵从这个规则。贝叶斯定理采用了一种新颖且更具一般性的形式,自然会引发更激烈的争议。坚信贝叶斯定理的人认为,对于所有事物,我们至少应该在有限的认知范围内根据严格的贝氏计算法来确定置信度,而其他人则认为贝氏规则更近似于一种宽松的定性指导原则。
1701024720
1701024721
出现RBRRB与RRRRR这两个结果的可能性都非常小,而且概率相同,但是在人们看来,前者是随机结果,后者则不是,这是为什么呢?贝叶斯的统计学观足以解释其原因。当看到RRRRR这个结果时,我们就会更加相信一个理论(即转轮做过手脚,小球会停在红色区域),对于这个理论,我们已经赋予了某个先验概率。但是,如果出现的结果是RBRRB呢?我们可以假设有这样一个人:
1701024722
1701024723
对于轮盘赌的转轮,他通常不带任何偏见,对于“转轮中藏有可以产生RBRRB这个结果的鲁布·戈德堡机械装置”这种想法,他会赋予一个中庸的概率。为什么不可以这样想呢?如果这样的一个人看到RBRRB这个结果,他会更加坚定自己的想法。
1701024724
1701024725
但是,在真实世界中,当轮盘赌的转轮真的产生RBRRB这个结果时,人们是不会这样想的。我们的有些想法合乎逻辑但非常荒谬,对于这样的想法,我们不会全盘接受。先验概率不是一视同仁,而是有所取舍的。在心理上,有的想法会得到明显的重视,而对于RBRRB这一类结果,我们赋予它们的先验概率几乎接近于零。那么,什么样的想法会受到我们的青睐呢?相较于复杂想法以及以完全陌生的现象为基础的想法,我们往往更喜欢简单的想法和那些通过类比我们所熟知的事物而产生的想法。这种喜好似乎是一种不公平的偏见,但是,如果没有任何偏见,我们就有可能整天都处于震惊的状态。理查德·费曼(Richard Feynman)有一段非常有名的话,描述的正是这种心理状态。
1701024726
1701024727
大家知道吗,今晚我遇到了一件非常奇怪的事。就在我来这儿的路上,当我从停车场经过时,一件令人难以置信的事情发生了,我看到一辆车的车牌号为ARW357。大家想一想,我们州有好几百万个车牌号,今天晚上我看到这个车牌号的概率是多少?这太让人吃惊了!
1701024728
1701024729
如果大家服用过美国最流行的某种打法律“擦边球”的精神药物,就会知道一视同仁的先验概率会给我们带来什么样的感觉。服用了那种药物之后,所有刺激都会让我们觉得意义深刻,无论这种刺激是多么平常。每种体验都会激起我们的兴趣,让我们欲罢不能。这样的精神状态非常有趣,但无助于我们做出正确的推理。
1701024730
1701024731
贝叶斯的观点可以解释费曼当时并没有真的感到吃惊的原因:对于“某种宇宙力量驱使他看到ARW357这个车牌号”的假设,他赋予了一个非常小的先验概率。他的观点还可以解释为什么小球连续5次停在红色区域会让人们觉得其“随机程度小于”RBRRB这个结果:因为前者会触发某个想法(即红色论),所以我们赋予这个想法的先验概率并不是非常小,但是后者没有这种作用。而且,末位数为0的数字的随机程度似乎小于末位数是7的数字,原因是前者会使我们产生这样的想法:我们看到的这个数字不是精确的统计数字,而是粗略估计得出的结果。
1701024732
1701024733
贝叶斯推理框架还可以帮助我们解决前文中遇到的难题。当彩票游戏连续两次开出“4、21、23、34、39”这个中奖号码时,我们感到非常吃惊,并且会心存疑虑。但是,如果某一天开出的中奖号码为“4、21、23、34、39”,另一天开出的中奖号码为“16、17、18、22、39”,对此我们丝毫不会觉得奇怪。这两种情况出现的可能性都很小,但为什么我们的反应却大相径庭呢?我们的思想深处隐藏着某种想法,认为很有可能出于某种神秘的原因,彩票游戏才会在很短的时间内两次开出同一组中奖号码。我们可能会认为彩票游戏的主管部门从中做了手脚,或者某种青睐同步性的宇宙力量发生了作用,但是这些都不重要。我们真诚地认为,同一组中奖号码重复出现的先验概率只有1/100 000。但是,与我们赋予“4、21、23、34、39”和“16、17、18、22、39”这两组中奖号码的先验概率相比,1/100 000仍然要大得多。认为不同的中奖号码是作弊产物的想法十分疯狂,而我们没有喝醉酒,头脑非常清醒,因此,我们不会把它当回事儿。
[
上一页 ]
[ :1.701024684e+09 ]
[
下一页 ]