打字猴:1.701017064e+09
1701017064
1701017065 (3)将距离最小的两个类合并成一个新类,计算新类与其他类的距离,再将距离最近的两类合并。
1701017066
1701017067 每次合并可减少类的数目,直至类的数目满足聚类的要求为止。这种方法称为系统聚类。
1701017068
1701017069 现在以d(i,k)表示第i个事物与第k个事物间的距离。类与类的距离可以用如下的方法规定:
1701017070
1701017071 设G1,G2,…表示类,用D(p,q)表示类Gp与类Gq之间的距离。类间距离有多种定义方法,常用的有最短距离、重心距离、闵可夫斯基距离等。我们在下面的例题中,不妨把D(p,q)规定为Gp和Gq之间的“最短距离”,即Gp中任一事物与Gq任一事物距离的最小值。
1701017072
1701017073 例 对某地21个古墓挖掘后,记录每个古墓陪葬的瓷器用具数和陶数据如表6.3.1所示:
1701017074
1701017075 表6.3.1 古墓文物数据
1701017076
1701017077
1701017078
1701017079
1701017080 此处,x1和x2可以看作平面直角坐标系中点的两个坐标,每个古墓可以用该坐标平面上的一个点来表示,得图6.3.1。我们采用通常平面上点的距离作为对应的古墓与古墓间的差别。
1701017081
1701017082 (1)从图和表都可看出,两个古墓的最小距离是1,其中下面几组古墓之间的距离都是1:
1701017083
1701017084 1号与2号,5号与6号,11号与5号,7号与9号,8号与9号,12号与13号,17号与18号,17号与19号。
1701017085
1701017086 把距离为1的点合成一类,就得到新的类,把这些新类用实线圈起来,如图6.3.2,分别记为G1,G2,…,G5。
1701017087
1701017088
1701017089
1701017090
1701017091
1701017092
1701017093 (2)以两个类中点的最短距离作为两个类的类间的距离。可计算得目前两个类间的最短距离为。此处4号墓与G2中的11号墓距离为,因而4号墓与G2的距离为。同样,10号墓与G3的距离、20号墓与G5的距离都是。把距离不大于的类归为一类,则得到新的类,如图6.3.3中实线所圈的集合。
1701017094
1701017095 (3)仍以两个类中点的最短距离作为两类之间的距离,则现在两个类间的最小距离为2,将类的距离不大于2的类合并成新类。在图6.3.3中新的类用虚线围成。现在,除去16、21这两点外,所有的点全在这4个类中。
1701017096
1701017097
1701017098
1701017099
1701017100 ▲ 图6.3.1 古墓文物按瓷器6用.3.1具数和陶俑数的分布图
1701017101
1701017102
1701017103
1701017104
1701017105 ▲ 图6.3.2 古墓文物第一次聚类图
1701017106
1701017107
1701017108
1701017109
1701017110 ▲ 图6.3.3 古墓文物第二次聚类图
1701017111
1701017112
1701017113
[ 上一页 ]  [ :1.701017064e+09 ]  [ 下一页 ]