1701024655
如果红色论是正确的,小球停在红色区域的概率为60%,那么,得到RRRRR结果的概率为:
1701024656
1701024657
0.6×0.6×0.6×0.6×0.6= 7.76%
1701024658
1701024659
接下来,我们把图中的三个部分扩充为6个部分。
1701024660
1701024661
1701024662
1701024663
1701024664
这幅图中的三列分别对应黑色论、公平论与红色论。但是,我们这次把每列分成了两个方框,一个方框表示得到了RRRRR的结果,另一个方框表示没有得到RRRRR的结果。我们已经完成了各种数学计算,知道应该在方框中填入哪些数字。例如,公平论的先验概率为0.9,这个先验概率的3.125%,即0.9×0.031 25(0.028 1),应该填入“公平论正确且小球5次停留的区域为RRRRR”的方框中,剩下的0.871 9则填入“公平论正确但停留区域不是RRRRR”的方框中。在表示公平论的这一列中,两个方框内数字的和仍然是0.9。
1701024665
1701024666
红色论的先验概率是0.05,因此,“红色论正确且结果为RRRRR”的先验概率是0.05×7.76%,即0.003 9;而“红色论正确但结果不是RRRRR”的方框中的数字是0.046 1。
1701024667
1701024668
黑色论的先验概率也是0.05。但是,黑色论与RRRRR这个结果之间的关系很不友好,因此,“黑色论正确且结果为RRRRR”的概率仅为0.05×1.024%,即0.000 5。
1701024669
1701024670
1701024671
1701024672
1701024673
请注意,6个方框中的数字总和是1。这是必须满足的条件,因为这6个方框代表的是所有可能的情况。
1701024674
1701024675
如果我们转动转轮并且真的得到了RRRRR的结果,那么这些理论会有什么变化呢?假如这种情况真的出现了,对红色论而言就是好消息,但对黑色论而言则是坏消息。小球连续5次停在红色区域,这种情况位于方框图的下排,黑色论、公平论与红色论的先验概率分别为0.000 5、0.028和0.003 9。换句话说,在这种情况下,公平论与红色论的先验概率比率大约是7∶1,红色论与黑色论的先验概率比率大约是8∶1。
1701024676
1701024677
如果希望把这些比率关系转化为概率,我们需要记住的就是三个概率的和必须是1。下排三个方框中的数字和约为0.032 5,在不改变比率关系的前提下,要使三个概率的和等于1,我们可以用每个数字除以0.032 5。于是,我们得到:
1701024678
1701024679
·黑色论正确的概率是1.5%;
1701024680
1701024681
·公平论正确的概率是86.5%;
1701024682
1701024683
·红色论正确的概率是12%。
1701024684
1701024685
由此可见,红色论的置信度增加了一倍多,而黑色论的置信度几乎消失殆尽。置信度的这种变化是十分恰当的,小球连续5次停在红色区域,我们对转轮受到人为操纵的怀疑当然会增加。
1701024686
1701024687
上述“用0.032 5除所有数字”的步骤似乎有使用特殊手段的嫌疑,事实上,这个步骤没有什么问题。如果我们的直觉无法立即接受这个做法,我们还有另一种讨人喜欢的办法。假设有1万个轮盘赌转轮,分别置于1万个房间之中,每个转轮由一个人操作。你也是操作者之一,但你不知道自己操作的是哪一个转轮,也不了解该转轮的真实属性。这种情况可以通过以下方式建模:假设在这1万个转轮中,有500个转轮偏向黑色区域,有500个偏向红色区域,还有9 000个是公平的。
1701024688
1701024689
依据上述概率进行计算,你可以预测出大约有281个公平的转轮、39个偏向红色区域的转轮、5个偏向黑色区域的转轮会得到RRRRR这一结果。因此,当你得到RRRRR的结果时,你仍然不知道自己在哪个房间中,但是你已经大幅缩小了范围:你所在的房间应该是小球连续5次停在红色区域的那325个房间中的一个。在所有这些房间中,有281间(约占86.5%)中是公平的转轮,有39间(约占12%)中是偏向红色区域的转轮,只有5间(约占1.5%)中是偏向黑色区域的转轮。
1701024690
1701024691
停在红色区域的球越多,你就会越倾向于红色论(同时黑色论的置信度会降低)。如果你连续10次(而不是5次)看到小球停在红色区域,通过类似的计算,你会将红色论正确的概率提升至25%。
1701024692
1701024693
上述计算步骤的目的是向我们展示,在连续5次看到小球停在红色区域之后,公平论、红色论、黑色论的置信度的变化情况,也就是所谓的“后验概率”
1701024694
1701024695
(posterior probability)。先验概率描述的是看到相关证据之前的置信度,而后验概率描述的是看到相关证据之后的置信度。我们所做的工作叫作“贝叶斯推理”(Bayesian inference),因为由先验概率到后验概率的中间桥梁是一个叫作“贝叶斯定理”(Bayes’s Theorem)的概率公式。该定理的代数表达式非常简单,我随时可以写给大家看,但在这里就免了。这是因为,如果我们习惯于机械地应用公式,而不考虑周围的环境,有时我们就很难理解眼前的形势。在这里,我们需要知道的已经全部包括在前文的方框图中了。[3]
1701024696
1701024697
后验概率不仅受到所发现的证据的影响,还会受到先验概率的影响。如果某人是怀疑论中坚分子,他会在一开始时就受到先验概率的影响,认为黑色论、公平论、红色论正确的概率都是1/3。但在连续5次看到小球停在红色区域之后,他又会受到后验概率的影响,认为红色论正确的概率为65%。对于一个信念坚定的人来说,如果一开始时他就认为红色论正确的概率仅为1%,那么,即使连续5次看到小球停在红色区域,他也会认为红色论正确的概率仅为2.5%。
1701024698
1701024699
在贝叶斯推理的框架中,人们在看到证据后,某种理论的置信度不仅取决于证据的内容,还取决于一开始时的置信度。
1701024700
1701024701
这个特点似乎会引起麻烦,科学不应该是客观的吗?我们可能以为,理论的置信度仅仅取决于证据,而不是我们一开始时的偏见。如果实验证据表明某种药物的改进型产品减缓了某些癌症的生长速度,而且这些证据具有统计学显著性,我们很可能就会相信这种新药真的有效。但是,如果我们让病人置身于巨石阵的塑料模型中,并且取得了同样的疗效,我们会不会心有不甘地承认,这些远古时期形成的巨石阵真的能抑制人体中肿瘤的生长呢?我们可能不会这样想,因为这个想法太疯狂了。我们更有可能认为,也许是因为巨石阵运气好。对于这两种情况,我们有多种先验概率,结果,我们在解释证据时却采用了不同的先验概率,尽管证据是一样的。
1701024702
1701024703
脸谱网筛选恐怖分子的算法以及我们对邻居是否是恐怖分子的判断,也是这种情况。邻居的名字出现在脸谱网的黑名单上,并不能证明他就是恐怖分子嫌疑人。大多数人都不是恐怖分子,因此该假设的先验概率应该非常小,在这种情况下,即使找到相关证据,后验概率仍然非常小,所以我们不用担心(至少不应该担心)。
1701024704
[
上一页 ]
[ :1.701024655e+09 ]
[
下一页 ]