1701024672
1701024673
请注意,6个方框中的数字总和是1。这是必须满足的条件,因为这6个方框代表的是所有可能的情况。
1701024674
1701024675
如果我们转动转轮并且真的得到了RRRRR的结果,那么这些理论会有什么变化呢?假如这种情况真的出现了,对红色论而言就是好消息,但对黑色论而言则是坏消息。小球连续5次停在红色区域,这种情况位于方框图的下排,黑色论、公平论与红色论的先验概率分别为0.000 5、0.028和0.003 9。换句话说,在这种情况下,公平论与红色论的先验概率比率大约是7∶1,红色论与黑色论的先验概率比率大约是8∶1。
1701024676
1701024677
如果希望把这些比率关系转化为概率,我们需要记住的就是三个概率的和必须是1。下排三个方框中的数字和约为0.032 5,在不改变比率关系的前提下,要使三个概率的和等于1,我们可以用每个数字除以0.032 5。于是,我们得到:
1701024678
1701024679
·黑色论正确的概率是1.5%;
1701024680
1701024681
·公平论正确的概率是86.5%;
1701024682
1701024683
·红色论正确的概率是12%。
1701024684
1701024685
由此可见,红色论的置信度增加了一倍多,而黑色论的置信度几乎消失殆尽。置信度的这种变化是十分恰当的,小球连续5次停在红色区域,我们对转轮受到人为操纵的怀疑当然会增加。
1701024686
1701024687
上述“用0.032 5除所有数字”的步骤似乎有使用特殊手段的嫌疑,事实上,这个步骤没有什么问题。如果我们的直觉无法立即接受这个做法,我们还有另一种讨人喜欢的办法。假设有1万个轮盘赌转轮,分别置于1万个房间之中,每个转轮由一个人操作。你也是操作者之一,但你不知道自己操作的是哪一个转轮,也不了解该转轮的真实属性。这种情况可以通过以下方式建模:假设在这1万个转轮中,有500个转轮偏向黑色区域,有500个偏向红色区域,还有9 000个是公平的。
1701024688
1701024689
依据上述概率进行计算,你可以预测出大约有281个公平的转轮、39个偏向红色区域的转轮、5个偏向黑色区域的转轮会得到RRRRR这一结果。因此,当你得到RRRRR的结果时,你仍然不知道自己在哪个房间中,但是你已经大幅缩小了范围:你所在的房间应该是小球连续5次停在红色区域的那325个房间中的一个。在所有这些房间中,有281间(约占86.5%)中是公平的转轮,有39间(约占12%)中是偏向红色区域的转轮,只有5间(约占1.5%)中是偏向黑色区域的转轮。
1701024690
1701024691
停在红色区域的球越多,你就会越倾向于红色论(同时黑色论的置信度会降低)。如果你连续10次(而不是5次)看到小球停在红色区域,通过类似的计算,你会将红色论正确的概率提升至25%。
1701024692
1701024693
上述计算步骤的目的是向我们展示,在连续5次看到小球停在红色区域之后,公平论、红色论、黑色论的置信度的变化情况,也就是所谓的“后验概率”
1701024694
1701024695
(posterior probability)。先验概率描述的是看到相关证据之前的置信度,而后验概率描述的是看到相关证据之后的置信度。我们所做的工作叫作“贝叶斯推理”(Bayesian inference),因为由先验概率到后验概率的中间桥梁是一个叫作“贝叶斯定理”(Bayes’s Theorem)的概率公式。该定理的代数表达式非常简单,我随时可以写给大家看,但在这里就免了。这是因为,如果我们习惯于机械地应用公式,而不考虑周围的环境,有时我们就很难理解眼前的形势。在这里,我们需要知道的已经全部包括在前文的方框图中了。[3]
1701024696
1701024697
后验概率不仅受到所发现的证据的影响,还会受到先验概率的影响。如果某人是怀疑论中坚分子,他会在一开始时就受到先验概率的影响,认为黑色论、公平论、红色论正确的概率都是1/3。但在连续5次看到小球停在红色区域之后,他又会受到后验概率的影响,认为红色论正确的概率为65%。对于一个信念坚定的人来说,如果一开始时他就认为红色论正确的概率仅为1%,那么,即使连续5次看到小球停在红色区域,他也会认为红色论正确的概率仅为2.5%。
1701024698
1701024699
在贝叶斯推理的框架中,人们在看到证据后,某种理论的置信度不仅取决于证据的内容,还取决于一开始时的置信度。
1701024700
1701024701
这个特点似乎会引起麻烦,科学不应该是客观的吗?我们可能以为,理论的置信度仅仅取决于证据,而不是我们一开始时的偏见。如果实验证据表明某种药物的改进型产品减缓了某些癌症的生长速度,而且这些证据具有统计学显著性,我们很可能就会相信这种新药真的有效。但是,如果我们让病人置身于巨石阵的塑料模型中,并且取得了同样的疗效,我们会不会心有不甘地承认,这些远古时期形成的巨石阵真的能抑制人体中肿瘤的生长呢?我们可能不会这样想,因为这个想法太疯狂了。我们更有可能认为,也许是因为巨石阵运气好。对于这两种情况,我们有多种先验概率,结果,我们在解释证据时却采用了不同的先验概率,尽管证据是一样的。
1701024702
1701024703
脸谱网筛选恐怖分子的算法以及我们对邻居是否是恐怖分子的判断,也是这种情况。邻居的名字出现在脸谱网的黑名单上,并不能证明他就是恐怖分子嫌疑人。大多数人都不是恐怖分子,因此该假设的先验概率应该非常小,在这种情况下,即使找到相关证据,后验概率仍然非常小,所以我们不用担心(至少不应该担心)。
1701024704
1701024705
单纯地依靠零假设显著性检验的做法,严重违背了贝叶斯推理的精神。严格地讲,这种做法会让人认为抗癌药物与巨石阵塑料模型有相同的疗效。费舍尔的统计学观会不会因此受到打击呢?事实恰好相反。费舍尔说过:“科研人员不会设一个固定的显著性临界值,然后年复一年,无论情况如何变化,都依据这条红线去推翻各种假设。相反,他们会在证据的启示下,结合自己的想法,认真考虑每一个具体案例。”这句话的意思是,科学推理不能(至少不应该)过于机械,推理时必须随时考虑先前的想法与置信度。
1701024706
1701024707
我并不是说费舍尔完全遵循了贝叶斯的统计学思想。在我们看来,费舍尔的这番话涵盖了一度不为人所接受,但如今已成为主流的一系列统计学行为与思想,其中包括贝叶斯定理。但是,费舍尔并不是主张将先前的置信度与新证据简单地放到一起考虑。贝叶斯定理对推理方法产生了广泛的影响,例如教会机器根据人们输入的大量数据来学习,但这些方法并不适用于回答是或否的问题。对于是或否的问题,人们常常借助费舍尔的方法做出判断。事实上,信奉贝叶斯定理的统计学家通常对显著性检验不屑一顾,他们对“该新药是否有疗效”之类的问题不感兴趣,他们更关注如何建立一个预测模型,以便更准确地判断该药物的不同剂量在针对不同人群时可以取得什么样的疗效。即便真的用到假设,他们对假设(例如,“新药的疗效胜过现有药物”)是否正确这个问题的关注度也没有那么高;而费舍尔则不同,在他看来,只有在随机过程正在进行的情况下,才可以使用概率这种表达方式。
1701024708
1701024709
说到这里,我们已经站在了哲学海洋的岸边了。对于这些哲学难题,本书会点到为止。
1701024710
1701024711
既然我们把贝叶斯定理称作定理,就表明它是不容置疑的,并且我们已经使用数学证据完成了相关证明。这种认识既对也不对,它涉及一个难题:“概率”
1701024712
1701024713
到底指什么?如果我们说红色论正确的概率为5%,我们可能是指,在全世界范围内其实有大量轮盘赌的转轮,其中正好有1/20的转轮偏向红色区域,小球停在红色区域的概率为3/5。而且,我们看到的任何轮盘赌的转轮,都是从这些转轮中随机选取的。如果是这样,贝叶斯定理就与上一章讨论的大数定理一样,都是千真万确的。大数定理认为,在本例所设定的条件下,在得出RRRRR这个结果的轮盘赌的转轮中,有12%的转轮是偏向红色区域的。
1701024714
1701024715
当认为红色论正确的概率为5%时,我们想说明的不是偏向红色区域的轮盘赌转轮在全球范围内的分布情况(这个问题我们怎么可能搞清楚呢),而是我们的一种心理状态。5%是“眼前这个转轮偏向红色区域”这种说法的置信度。
1701024716
1701024717
顺便说一句,费舍尔就是从这里开始与其他人分道扬镳的。约翰·梅纳德·凯恩斯(John Maynard Keynes)在《概率论》(Treatise on Probability)中指出,概率“测量的是人们结合已知证据后赋予命题的‘合理置信度’”。费舍尔对这个观点提出了严厉的批评,他的最后几句话很好地概括了他的看法:“如果美国数学系的学生认为凯恩斯先生在该书最后一章中的观点是权威观点并加以接受,他们就会在应用数学最有前景的分支领域中误入歧途,有的人会讨厌这些研究,大多数人则会变得愚昧无知。”
1701024718
1701024719
对于那些愿意接受概率就是置信度这种观点的人而言,贝叶斯定理不仅可以被看作一个数学方程式,还是一种偏重于数值的规则,它告诉我们如何结合新的观察结果修正我们赋予事物的置信度。当然,我们可以选择是否遵从这个规则。贝叶斯定理采用了一种新颖且更具一般性的形式,自然会引发更激烈的争议。坚信贝叶斯定理的人认为,对于所有事物,我们至少应该在有限的认知范围内根据严格的贝氏计算法来确定置信度,而其他人则认为贝氏规则更近似于一种宽松的定性指导原则。
1701024720
1701024721
出现RBRRB与RRRRR这两个结果的可能性都非常小,而且概率相同,但是在人们看来,前者是随机结果,后者则不是,这是为什么呢?贝叶斯的统计学观足以解释其原因。当看到RRRRR这个结果时,我们就会更加相信一个理论(即转轮做过手脚,小球会停在红色区域),对于这个理论,我们已经赋予了某个先验概率。但是,如果出现的结果是RBRRB呢?我们可以假设有这样一个人:
[
上一页 ]
[ :1.701024672e+09 ]
[
下一页 ]