1700507890
(1)已知类条件概率密度参数表达式和先验概率。
1700507891
1700507892
(2)利用贝叶斯公式将其转换成后验概率。
1700507893
1700507894
(3)根据后验概率的大小进行决策分类。
1700507895
1700507896
朴素贝叶斯分类的方式则不太一样。贝叶斯概率研究的是条件概率,也就是说,研究的场景就是带有某些前提条件或者在某些背景条件的约束下发生的概率问题。
1700507897
1700507898
上面基于对于样本空间中两个事件(事件A和事件B)的条件概率描述,完整的贝叶斯公式如下。
1700507899
1700507900
1700507901
1700507902
1700507903
如图11-25所示,设D1, D2, …, Dn为样本空间S的一个划分,如果以表示Di发生的概率,且。对于任一事件x,,有
1700507904
1700507905
1700507906
1700507907
1700507908
1700507909
1700507910
1700507911
图11-25 朴素贝叶斯(2)
1700507912
1700507913
也就是说,这可以推广到事件x和事件集合Dj。
1700507914
1700507915
Di表示不同的事件划分,而且用Di可以把整个空间划分完毕。在每个Di事件发生的同时都进行事件x发生与否的记录,并记录在Di发生的情况下x的发生概率。
1700507916
1700507917
1700507918
可以化简成P(x),因为它代表整个事件空间内在所有的事件Di发生的前提下发生事件x的概率的一个加和。
1700507919
1700507920
所以,最后等式两边就化简成
1700507921
1700507922
1700507923
1700507924
1700507925
也就是说,在全样本空间内,发生x的概率乘以在发生x的情况下发生Dj的概率,等于发生Dj的概率乘以在发生Dj的情况下发生x的概率。
1700507926
1700507927
1700507928
1700507929
如图11-25所示,左侧的圆面积代表发生x的概率,右侧的圆面积代表发生Dj的概率,中间的交集就是等号两边各自表示的内容,也就是或的值。
1700507930
1700507931
朴素贝叶斯分类器是在机器学习中应用最为广泛的一种分类器。与其说它是一个公式,不如说它是一种思想或者思维方式。对贝叶斯概率解决的问题我们可以这样看待:对任何事情的认知,首先可以通过统计的方法得出事情发生的概率。这个概率叫作“先验概率”,是指在一种非特定(或不明确)条件下的概率判断。然而,一旦引入了其他维度(也就是事件认知维度增加),如果通过统计发现其中一件事情的增加或减少会影响另一件事情发生的概率,那么这两件事情的关联性可以通过统计量化表示。这个量化表示非常重要,它不仅能够说明一件事情的发生对另一件事情的发生概率有影响,还能告诉我们这个影响具体有多大,也就是说,贝叶斯概率模型是量化因果关系的科学认知方法。
1700507932
1700507933
2.回归
1700507934
1700507935
回归(Regression)也是一种通过归纳样本特征向量和分类向量的关系得到模型表达式的过程。常见的回归有线性回归(Linear Regression)、非线性回归(Non-Linear Regression)和逻辑回归(Logistic Regression)等。
1700507936
1700507937
线性回归的表达式是
1700507938
1700507939
[
上一页 ]
[ :1.70050789e+09 ]
[
下一页 ]