1704438249
1704438250
原因在于,大自然完美无缺,人类对自然的认知和了解却缺憾万千,二者之间又断了联系。当天文观测显示木星和土星的运动轨迹出现异常时,拉普拉斯几乎要崩溃了,因为按照他的预测,木星即将撞上太阳,而土星即将飞入外太空。当然,这些预测都是错的,而拉普拉斯毕生都致力于测量这些行星的运行轨迹,力求得到更加准确的数据。那时,望远镜这样的仪器还不够精密,因此拉普拉斯所取得的进步只能依赖概率推理而非精确的测量。在拉普拉斯的眼中,概率是介于无知与博闻之间的基准点,更透彻地理解概率对科学进步极为重要。
1704438251
1704438252
18世纪时,贝叶斯和拉普拉斯对概率、预测和科学进步之间的内在联系理解得更加透彻,借助几百年前发明的印刷机,人类社会由此开始进入信息大爆炸时期,并最终将这些信息应用于推动科学、技术和经济的持续进步。这种内在联系至关重要,与预测行星运行轨迹和湖人队能否夺冠一样重要。就像我们即将看到的那样,当另外一种不同的统计模型成为20世纪的主导时,这种模型不再强调预测的作用,而是试图将不确定性说成我们测量失误的结果,与我们错误的判断无关,科学发展就会受到牵绊。
1704438253
1704438254
简单的运算推导出重大的预测
1704438255
1704438256
如果说贝叶斯定理的哲学基础惊人地深厚,那么相比而言,其数学运算就少得可怜了。在其最基本的形式中,数学运算只是个代数表达式,包含3个已知变量和一个未知变量。然而,就是这样一个简单的运算,却可以推导出重大的预测。
1704438257
1704438258
贝叶斯定理涉及条件概率,也就是说,一旦发生了某个事件,这一定理就可以告诉我们一种理论或假设是否正确。
1704438259
1704438260
假设你和伴侣同住,某天出差回家后发现自己的衣橱里多出一件陌生的内衣。你可能会奇怪:自己的伴侣是不是出轨了?前提条件是,你找到了内衣,你想要评估的是自己的伴侣出轨的可能性。不论你相信与否,对于这样的问题,贝叶斯定理总能给出答案——假如你知道(或者有意愿预估)下列3个量:
1704438261
1704438262
第一,你需要预测出自己的伴侣在出轨的情况下,这件内衣出现的概率。为了解决这个问题,我们暂且假设你是一位女性,而你的伴侣是一位男性,那么,此时我们所说的内衣就是一件女式内衣。如果你的伴侣出轨了,那么很容易想象这件内衣是如何进入你的衣橱的。那么,即使他确实要做对不起你的事,你也希望他能够小心行事。在他确实背叛了你的情况下,我们认为,这件内衣出现的概率是50%。
1704438263
1704438264
第二,你需要预测出自己的伴侣在没有出轨的情况下,这件内衣出现的概率。如果他没有出轨,有什么理由证明那件内衣的清白呢?当然有些理由会令人不快(比如这件内衣也有可能是他自己的)。或许,他把衣服搞混了;或者你的伴侣有一位红颜知己,两人之间只存在纯友谊,而你对此也深信不疑,她寄宿一晚忘了带走内衣;或者这就是你的伴侣给你准备的一件礼物,只不过忘了把它包起来。尽管这些理由有些荒谬,但也能说得通。你将这种情况出现的概率定为5%。
1704438265
1704438266
第三,这点最为重要,你需要预测贝叶斯定理中所说的先验概率(或者简称先验)。在发现内衣之前,你认为自己的伴侣出轨的概率有多大?当然,现在很难完全客观地考虑这个问题,因为你已经发现了内衣。(在理想状态下,在开始查验证据之前,你就已经算出了先验概率。)但有时我们可以依据经验推断某事件发生的概率。比如,研究发现,已婚夫妇任何一年的出轨概率都在4%左右,所以,我们可以将这个概率视为先验概率。
1704438267
1704438268
如果我们算出了以上3个概率值,就可以依据贝叶斯定理得出后验概率。令我们感兴趣的是这样的数据:在发现内衣的情况下,伴侣背叛我们的概率有多大?计算结果(和计算所得出的简单代数表达式)见表8–2。
1704438269
1704438270
从图中可以看到,这一概率非常低:只有29%,这个结果也许看似仍有悖常理——那件内衣果真是清白的吗?但这一概率之所以较低,是因为你把伴侣出轨的先验概率设定得很低。尽管一个清白的男人不能像出过轨的男人那样,能为一件陌生内衣的出现找出很多看似合理的解释,但你一开始就把他当作清白的人,这一点对方程式中影响很大。
1704438271
1704438272
表8–2 贝叶斯定理——内衣例子
1704438273
1704438274
先验概率
1704438275
1704438276
男友出轨的初始概率预测
1704438277
1704438278
x
1704438279
1704438280
4%
1704438281
1704438282
新事件:发现神秘内衣
1704438283
1704438284
在男友出轨的情况下,内衣出现的概率
1704438285
1704438286
y
1704438287
1704438288
50%
1704438289
1704438290
在男友未出轨的情况下,内衣出现的概率
1704438291
1704438292
z
1704438293
1704438294
5%
1704438295
1704438296
后验概率
1704438297
1704438298
在你发现内衣的情况下,修正对男友出轨的预测值
[
上一页 ]
[ :1.704438249e+09 ]
[
下一页 ]