1700535426
1700535427
1700535428
1700535429
1700535430
(5.10)
1700535431
1700535432
1700535433
1700535434
其中是模型的隐变量。直观地理解,就是当样本x离第k个簇的中心点μk距离最近时,概率正比于,否则为0。
1700535435
1700535436
在E步骤,计算
1700535437
1700535438
1700535439
1700535440
1700535441
(5.11)
1700535442
1700535443
这等同于在K均值算法中对于每一个点x(i)找到当前最近的簇z(i)。
1700535444
1700535445
1700535446
在M步骤,找到最优的参数,使得似然函数最大:
1700535447
1700535448
1700535449
.
1700535450
1700535451
(5.12)
1700535452
1700535453
经过推导可得
1700535454
1700535455
1700535456
.
1700535457
1700535458
(5.13)
1700535459
1700535460
1700535461
1700535462
因此,这一步骤等同于找到最优的中心点,使得损失函数达到最小,此时每个样本x(i)对应的簇z(i)已确定,因此每个簇k对应的最优中心点μk可以由该簇中所有点的平均计算得到,这与K均值算法中根据当前簇的分配更新聚类中心的步骤是等同的。
1700535463
1700535464
1700535465
1700535466
1700535468
百面机器学习:算法工程师带你去面试 02 高斯混合模型
1700535469
1700535470
1700535471
1700535472
场景描述
1700535473
1700535474
高斯混合模型(Gaussian Mixed Model,GMM)也是一种常见的聚类算法,与K均值算法类似,同样使用了EM算法进行迭代计算。高斯混合模型假设每个簇的数据都是符合高斯分布(又叫正态分布)的,当前数据呈现的分布就是各个簇的高斯分布叠加在一起的结果。
1700535475
[
上一页 ]
[ :1.700535426e+09 ]
[
下一页 ]