打字猴:1.700535408e+09

1700535408

1700535409 由上面的推导，EM算法框架可以总结如下，由以下两个步骤交替进行直到收敛。

1700535410

1700535411 （1）E步骤：计算隐变量的期望

1700535412

1700535413

1700535414 ．

1700535415

1700535416 （5.8）

1700535417

1700535418 （2）M步骤：最大化

1700535419

1700535420

1700535421 ．

1700535422

1700535423 （5.9）

1700535424

1700535425 剩下的事情就是说明K均值算法与EM算法的关系了。K均值算法等价于用EM算法求解以下含隐变量的最大似然问题：

1700535426

1700535427

1700535428

1700535429

1700535430 （5.10）

1700535431

1700535432

1700535433

1700535434 其中是模型的隐变量。直观地理解，就是当样本x离第k个簇的中心点μk距离最近时，概率正比于，否则为0。

1700535435

1700535436 在E步骤，计算

1700535437

1700535438

1700535439

1700535440

1700535441 （5.11）

1700535442

1700535443 这等同于在K均值算法中对于每一个点x(i)找到当前最近的簇z(i)。

1700535444

1700535445

1700535446 在M步骤，找到最优的参数，使得似然函数最大：

1700535447

1700535448

1700535449 ．

1700535450

1700535451 （5.12）

1700535452

1700535453 经过推导可得

1700535454

1700535455

1700535456 ．

1700535457

[ 上一页 ] [ :1.700535408e+09 ] [ 下一页 ]