1700507880
1700507881
这就是朴素贝叶斯模型公式(Naive Bayesian,如图11-24所示)。其中,P(A)叫作事件A的先验概率,是指一般情况下我们认为事件A发生的概率;(|)P B A叫作似然度,是指事件A假设条件成立的情况下发生事件B的概率;(|)P A B叫作后验概率,是指在事件B发生的情况下发生事件A的概率,也就是我们要计算的概率;P(B)叫作标准化常量,和事件A的先验概率定义类似,就是一般情况下事件B发生的概率。
1700507882
1700507883
1700507884
1700507885
1700507886
图11-24 朴素贝叶斯(1)
1700507887
1700507888
贝叶斯决策理论方法是统计模型决策中的一个基本方法,其基本思想如下。
1700507889
1700507890
(1)已知类条件概率密度参数表达式和先验概率。
1700507891
1700507892
(2)利用贝叶斯公式将其转换成后验概率。
1700507893
1700507894
(3)根据后验概率的大小进行决策分类。
1700507895
1700507896
朴素贝叶斯分类的方式则不太一样。贝叶斯概率研究的是条件概率,也就是说,研究的场景就是带有某些前提条件或者在某些背景条件的约束下发生的概率问题。
1700507897
1700507898
上面基于对于样本空间中两个事件(事件A和事件B)的条件概率描述,完整的贝叶斯公式如下。
1700507899
1700507900
1700507901
1700507902
1700507903
如图11-25所示,设D1, D2, …, Dn为样本空间S的一个划分,如果以表示Di发生的概率,且。对于任一事件x,,有
1700507904
1700507905
1700507906
1700507907
1700507908
1700507909
1700507910
1700507911
图11-25 朴素贝叶斯(2)
1700507912
1700507913
也就是说,这可以推广到事件x和事件集合Dj。
1700507914
1700507915
Di表示不同的事件划分,而且用Di可以把整个空间划分完毕。在每个Di事件发生的同时都进行事件x发生与否的记录,并记录在Di发生的情况下x的发生概率。
1700507916
1700507917
1700507918
可以化简成P(x),因为它代表整个事件空间内在所有的事件Di发生的前提下发生事件x的概率的一个加和。
1700507919
1700507920
所以,最后等式两边就化简成
1700507921
1700507922
1700507923
1700507924
1700507925
也就是说,在全样本空间内,发生x的概率乘以在发生x的情况下发生Dj的概率,等于发生Dj的概率乘以在发生Dj的情况下发生x的概率。
1700507926
1700507927
1700507928
1700507929
如图11-25所示,左侧的圆面积代表发生x的概率,右侧的圆面积代表发生Dj的概率,中间的交集就是等号两边各自表示的内容,也就是或的值。
[
上一页 ]
[ :1.70050788e+09 ]
[
下一页 ]