1702659190
其中,分别有{Xi∈Gk,Xj∈Gp;Xi∈Gk,Xj∈Gq}
1702659191
1702659192
=max{Dkp,Dkq}
1702659193
1702659194
再将非对角线上最小元素的两类并类,直至所有的样品全部归为一类为止。
1702659195
1702659196
易见最长距离法与最短距离法只有两点不同:一是类与类之间的距离定义不同;二是计算新类与其他类的距离所用的公式不同。
1702659197
1702659198
在前面示例1中,如果应用最长距离法按聚类步骤1~3,可得D(0)、D(1)、D(2)和D(3)距离阵,计算结果分别如图12.15至图12.18所示。
1702659199
1702659200
1702659201
1702659202
1702659203
图12.15 距离阵D(0)计算结果
1702659204
1702659205
1702659206
1702659207
1702659208
图12.16 距离阵D(1)计算结果
1702659209
1702659210
1702659211
1702659212
1702659213
图12.17 距离阵D(2)计算结果
1702659214
1702659215
1702659216
1702659217
1702659218
图12.18 距离阵D(3)计算结果
1702659219
1702659220
至此,已将5个样本成功分为两类:{X1,X2,X3}与{X4,X5},即用最长距离法得出X1,X2,X3性质更加相近,X4,X5性质更加相近。
1702659221
1702659222
简单地说,最长距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。
1702659223
1702659224
最长距离聚类法的计算公式如下:
1702659225
1702659226
drk=max{dpk,dqk}(k≠p,q)
1702659227
1702659228
示例3:
1702659229
1702659230
仍旧沿用示例2中使用的原始数据的距离阵(见图12.6),将最短距离聚类法改为最长距离聚类法。
1702659231
1702659232
对该数据文本聚类过程的具体操作步骤如下:
1702659233
1702659234
①在图12.6所示的9×9阶距离阵D中,非对角线元素中最小者是d94=0.51,将第4区与第9区并为一类,记为G10,即G10={G4,G9}。按照计算公式drk=max{dpk,dqk}(k≠p,q)分别计算G1、G2、G3、G5、G6、G7、G8与G10之间的距离,即可得到一个新的8×8阶距离阵,如图12.19所示。
1702659235
1702659236
1702659237
1702659238
1702659239
图12.19 8×8阶距离阵
[
上一页 ]
[ :1.70265919e+09 ]
[
下一页 ]