1702659210
1702659211
1702659212
1702659213
图12.17 距离阵D(2)计算结果
1702659214
1702659215
1702659216
1702659217
1702659218
图12.18 距离阵D(3)计算结果
1702659219
1702659220
至此,已将5个样本成功分为两类:{X1,X2,X3}与{X4,X5},即用最长距离法得出X1,X2,X3性质更加相近,X4,X5性质更加相近。
1702659221
1702659222
简单地说,最长距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。
1702659223
1702659224
最长距离聚类法的计算公式如下:
1702659225
1702659226
drk=max{dpk,dqk}(k≠p,q)
1702659227
1702659228
示例3:
1702659229
1702659230
仍旧沿用示例2中使用的原始数据的距离阵(见图12.6),将最短距离聚类法改为最长距离聚类法。
1702659231
1702659232
对该数据文本聚类过程的具体操作步骤如下:
1702659233
1702659234
①在图12.6所示的9×9阶距离阵D中,非对角线元素中最小者是d94=0.51,将第4区与第9区并为一类,记为G10,即G10={G4,G9}。按照计算公式drk=max{dpk,dqk}(k≠p,q)分别计算G1、G2、G3、G5、G6、G7、G8与G10之间的距离,即可得到一个新的8×8阶距离阵,如图12.19所示。
1702659235
1702659236
1702659237
1702659238
1702659239
图12.19 8×8阶距离阵
1702659240
1702659241
②在图12.19所示的8×8阶距离阵中,非对角线元素中最小者为d57=0.83,故将G5与G7归并为一类,记为G11,即G11={G5,G7}。按照计算公式drk=max{dpk,dqk}(k≠p,q)分别计算G1、G2、G3、G6、G8、G10与G11之间的距离,即可得到一个新的7×7阶距离阵,如图12.20所示。
1702659242
1702659243
1702659244
1702659245
1702659246
图12.20 7×7阶距离阵
1702659247
1702659248
③在图12.20所示的7×7阶距离阵中,非对角线元素中最小者为d28=0.88,故将G2与G8归并为一类,记为G12,即G12={G2,G8}。再按照计算公式drk=max{dpk,dqk}(k≠p,q)分别计算G1、G3、G6、G10、G11与G12之间的距离,即可得到一个新的6×6阶距离阵,如图12.21所示。
1702659249
1702659250
1702659251
1702659252
1702659253
图12.21 6×6阶距离阵
1702659254
1702659255
④在图12.21所示的6×6阶距离阵中,非对角线元素中最小者为d3,10=1.23,故将G3与G10归并为一类,记为G13,即G13={G3,G10}={G3,(G4,G9)}。再按照计算公式drk=max{dpk,dqk}(k≠p,q)分别计算G1、G6、G10、G12与G13之间的距离,即可得到一个新的5×5阶距离阵,如图12.22所示。
1702659256
1702659257
1702659258
1702659259
[
上一页 ]
[ :1.70265921e+09 ]
[
下一页 ]