打字猴:1.70053611e+09
1700536110
1700536111 (6.22)
1700536112
1700536113
1700536114 其中会在局部进行归一化,即枚举xi的全部取值进行求和之后计算概率,计算公式为
1700536115
1700536116
1700536117
1700536118
1700536119 (6.23)
1700536120
1700536121 其中Z为归一化因子
1700536122
1700536123
1700536124
1700536125
1700536126 (6.24)
1700536127
1700536128
1700536129
1700536130 其中为所有特征的线性叠加。
1700536131
1700536132 最大熵马尔可夫模型存在标注偏置问题,如图6.7所示。可以发现,状态1倾向于转移到状态2,状态2倾向于转移到状态2本身。但是实际计算得到的最大概率路径是1->1->1->1,状态1并没有转移到状态2,如图6.8所示。这是因为,从状态2转移出去可能的状态包括1、2、3、4、5,概率在可能的状态上分散了,而状态1转移出去的可能状态仅仅为状态1和2,概率更加集中。由于局部归一化的影响,隐状态会倾向于转移到那些后续状态可能更少的状态上,以提高整体的后验概率。这就是标注偏置问题。
1700536133
1700536134
1700536135
1700536136
1700536137 图6.7 最大熵马尔可夫模型示例
1700536138
1700536139
1700536140
1700536141
1700536142 图6.8 标注偏置
1700536143
1700536144 条件随机场(Conditional Random Field,CRF)在最大熵马尔可夫模型的基础上,进行了全局归一化,如图6.9所示。
1700536145
1700536146
1700536147
1700536148
1700536149 图6.9 条件随机场
1700536150
1700536151 条件随机场建模如下
1700536152
1700536153
1700536154
1700536155
1700536156 (6.25)
1700536157
1700536158 其中归一化因子Z(y1…n)是在全局范围进行归一化,枚举了整个隐状态序列x1…n的全部可能,从而解决了局部归一化带来的标注偏置问题。
1700536159
[ 上一页 ]  [ :1.70053611e+09 ]  [ 下一页 ]