1702659174
Excel统计分析与应用大全 12.1.4 最长距离法
1702659175
1702659176
定义类Gi与类Gj之间的距离为两类最远样品的距离,即
1702659177
1702659178
Dpq=max dij
1702659179
1702659180
其中,Xi∈Gp,Xj∈Gq
1702659181
1702659182
最长距离法与最短距离法的并类步骤完全一样,也是将各样品先自成一类,然后将非对角线上最小元素对应的两类合并。假设某一步将类Gp与Gq合并为Gr,则任一类Gk与Gr的距离用最长距离公式表达为:
1702659183
1702659184
Dkr=max dij
1702659185
1702659186
其中,Xi∈Gk,Xj∈Gr
1702659187
1702659188
=max{max dij,max dij}
1702659189
1702659190
其中,分别有{Xi∈Gk,Xj∈Gp;Xi∈Gk,Xj∈Gq}
1702659191
1702659192
=max{Dkp,Dkq}
1702659193
1702659194
再将非对角线上最小元素的两类并类,直至所有的样品全部归为一类为止。
1702659195
1702659196
易见最长距离法与最短距离法只有两点不同:一是类与类之间的距离定义不同;二是计算新类与其他类的距离所用的公式不同。
1702659197
1702659198
在前面示例1中,如果应用最长距离法按聚类步骤1~3,可得D(0)、D(1)、D(2)和D(3)距离阵,计算结果分别如图12.15至图12.18所示。
1702659199
1702659200
1702659201
1702659202
1702659203
图12.15 距离阵D(0)计算结果
1702659204
1702659205
1702659206
1702659207
1702659208
图12.16 距离阵D(1)计算结果
1702659209
1702659210
1702659211
1702659212
1702659213
图12.17 距离阵D(2)计算结果
1702659214
1702659215
1702659216
1702659217
1702659218
图12.18 距离阵D(3)计算结果
1702659219
1702659220
至此,已将5个样本成功分为两类:{X1,X2,X3}与{X4,X5},即用最长距离法得出X1,X2,X3性质更加相近,X4,X5性质更加相近。
1702659221
1702659222
简单地说,最长距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。
[
上一页 ]
[ :1.702659173e+09 ]
[
下一页 ]