打字猴:1.70096484e+09
1700964840
1700964841 现在我们已经有了贝叶斯定理的构件。贝叶斯定理就是下面这个简单的等式。
1700964842
1700964843 p(+)×p(+→L)=p(L)×p(L→+)
1700964844
1700964845 直观地看,它非常容易理解。将上面的概率写成百分比的形式,它表达的是一个显然的事实。在所有人中,找出化验结果为阳性的人p(+),在这些人中再筛选出那些确实得了该癌症的人p(+→L)。或者,你可以用另外一种方式,先选出那些确实得癌症的人p(L),在这些人中再筛选出化验结果为阳性的人p(L→+)。两种不同的方式你最终筛选出来的都是同一群人,即那些得了该癌症且测量结果为阳性的人。
1700964846
1700964847 下面我们用具体数字计算。
1700964848
1700964849 这种癌症的发病率为p(L)=0.5%。等式右边的第二项p(L→+)估算的是一个人得了该癌症,化验结果为阳性的可能性。由于这个化验是如此的可靠,可以用p(L→+)≈100%作为很好的近似。当你的医生打电话告诉你坏消息时,正是这个数字引起你的焦虑。知道这个化验是几乎百分之百的准确,大多数人直觉上都会感到阳性的化验结果几乎肯定意味着确诊患有该癌症。但是他们都错了!
1700964850
1700964851 最诡异的是公式中的p(+),它反映的是在人群中做化验后结果为阳性的概率。0.5%的人确实患有该癌症,因此他们的化验结果极有可能为阳性。但是健康人群(整个人群的绝大多数)中的1%会不幸得到一个错误的化验结果——假阳性,因此整个人群的化验结果为阳性的比例p(+)≈1.5%。
1700964852
1700964853 将上面的数字带入等式,左右两边同时除以p(+)。那么在知道你的化验结果为阳性时,你患病的概率为p(+→L)≈0.5%×100%/1.5%=100%/3≈33%。(注意中间一步分子分母中出现的两个%消掉了)。贝叶斯定理告诉你患病的概率只有大约1/3。统计数据告诉你患该病的概率是0.5%,而化验结果本身则暗示你患病的概率是100%,但贝叶斯定理的结果则是一个合理的折中。真叫人宽慰!你需要明智地再做一次化验。由于不太可能恰好两次都是假阳性,重复化验会极大地降低不确定性——更好的结果或者更坏的结果。
1700964854
1700964855
1700964856
1700964857
1700964858 图2.2
1700964859
1700964860 下面这个被奇怪分割的饼状图描绘的是群体数为1万人的真实统计数据,从中你可以得到(大概)的百分比。被标记49和99的那两部分都是化验结果是阳性的人群。由于你在这两类中的其中一种内,但是你并不知道在哪个人群中(见图2.2),因此你患病的概率是1/3,这正是贝叶斯定理预言的结果。对于更一般的情况,+可以用I代替,意思是新的信息,表情符号L用E,意思是某事件。做了这些替换之后,再将等式两边同时除以P(I),我们就得到了贝叶斯定理的常见的形式:
1700964861
1700964862 p(I→E)=p(E)×p(E→I)/p(I)
1700964863
1700964864 在某种程度上来说,这两个条目组成了汉堡的牛排和芝士,而另外两个则组成了汉堡的小面包。等式右边第一项p(E)指没考虑新的信息I时事件E发生的概率。由于这个原因p(E)也被称为先验概率(prior probability)。有时它只是开始不知情状况下的一个猜想,我们期待着反复使用贝叶斯定理可以不断改善它。等式左右边的p(I→E)指事件E在获取新的信息I之后修正过的新(或者后验)概率。另外两项则影响着修正过程。通过简单的规则不断修正先验概率是贝叶斯概率的核心[3]。
1700964865
1700964866 在上面那个癌症例子中,接到医生的电话之前你自己对患病概率的估计——先验概率——是0.5%。知道化验结果之后,你担心自己患病概率几乎上升为100%,这也是不正确的。贝叶斯定理显示这个概率被修正为33%。
1700964867
1700964868 贝叶斯定理的强大之处在于它能够将不同来源的信息组合起来。频率论除了对一些均匀的数据集合外很难做到这一点。上面的例子中先验概率源于人群中大规模的统计研究,然而癌症化验的准确性大概是基于一些特定的临床试验。贝叶斯定理的计算不仅可以利用一些数据资料,甚至历史或者直觉都能帮助代理人选择先验概率然后不断修正。上一节那个会堂中的赌徒例子,据说他连续100次都是正面向上,因此我才会决定不和他赌博,这说明了现实生活中引入新的信息并改变相应的概率估计是非常有用的,只要把概率定义为置信程度。
1700964869
1700964870 相比于频率论,贝叶斯理论更普遍,逻辑清楚,且用途广泛,因此它渐渐被接纳为概率基本的解释。气候学对唯一的大气层做出预测,需要从各种各样的来源收集证据和信息,贝叶斯概率理论则是经常被用到的数学工具。其他学科,包括社会科学、生物学、药学和工程学,都在用贝叶斯概率。频率论中简单的公式“事件发生次数除以总试验次数”可以得到概率的数值,但是贝叶斯理论提供了这些数字的真正的含义。下面这个测量一张奇怪形状纸的面积的例子能展现测定和定义的本质差别:虽然面积可以通过纸的重量(单位:克)除以密度(单位:克/平方米)得到,但面积的含义是完全几何的,与重量和密度无关。
1700964871
1700964872 前面我们已经知道,量子力学在根本上也是依赖于概率的,让我们拭目以待,当贝叶斯概率遇上量子力学会碰撞出什么火花?
1700964873
1700964874 [1]英文Bayes’是Bayes’s和Bayes折中后的形式。
1700964875
1700964876 [2]可参考W.T.Eadie,D.Drijard,F.E.James,M.Roos,and B.Sadoulet,Statistical Methods in Experimental Physics(Geneva,Switzerland:CERN,1971)。
1700964877
1700964878 [3]需要指出的是,当先验概率是0或者1时,新的信息并不会改变它。
1700964879
1700964880
1700964881
1700964882
1700964883 概率的烦恼:量子贝叶斯拯救薛定谔的猫 [:1700964157]
1700964884 概率的烦恼:量子贝叶斯拯救薛定谔的猫 第三章 量子贝叶斯理论
1700964885
1700964886 概率的烦恼:量子贝叶斯拯救薛定谔的猫 [:1700964158]
1700964887 第11节 量子贝叶斯理论使事情明晰
1700964888
1700964889 就像水面宽阔的河流在流向大海的过程中是通过吸收很多小溪小河逐渐变大一样,科学也在兼收并蓄着各种新的数据和知识的细流中前进。形成鲜明对比的是,量子贝叶斯理论则是汇聚了两条大的支流。21世纪初,作为一门古老而又复杂的学科,量子力学和始于18世纪、最近复兴的数学分支——贝叶斯概率结合起来,形成各种已经确定的知识的汇集。量子贝叶斯理论的创造者既没有创造Q也没有发明B,而是将它们结合在一起,不仅对量子力学本身,而且对一般的科学世界观也有着深远的影响。
[ 上一页 ]  [ :1.70096484e+09 ]  [ 下一页 ]