1701017070
1701017071
设G1,G2,…表示类,用D(p,q)表示类Gp与类Gq之间的距离。类间距离有多种定义方法,常用的有最短距离、重心距离、闵可夫斯基距离等。我们在下面的例题中,不妨把D(p,q)规定为Gp和Gq之间的“最短距离”,即Gp中任一事物与Gq任一事物距离的最小值。
1701017072
1701017073
例 对某地21个古墓挖掘后,记录每个古墓陪葬的瓷器用具数和陶数据如表6.3.1所示:
1701017074
1701017075
表6.3.1 古墓文物数据
1701017076
1701017077
1701017078
1701017079
1701017080
此处,x1和x2可以看作平面直角坐标系中点的两个坐标,每个古墓可以用该坐标平面上的一个点来表示,得图6.3.1。我们采用通常平面上点的距离作为对应的古墓与古墓间的差别。
1701017081
1701017082
(1)从图和表都可看出,两个古墓的最小距离是1,其中下面几组古墓之间的距离都是1:
1701017083
1701017084
1号与2号,5号与6号,11号与5号,7号与9号,8号与9号,12号与13号,17号与18号,17号与19号。
1701017085
1701017086
把距离为1的点合成一类,就得到新的类,把这些新类用实线圈起来,如图6.3.2,分别记为G1,G2,…,G5。
1701017087
1701017088
1701017089
1701017090
1701017091
1701017092
1701017093
(2)以两个类中点的最短距离作为两个类的类间的距离。可计算得目前两个类间的最短距离为。此处4号墓与G2中的11号墓距离为,因而4号墓与G2的距离为。同样,10号墓与G3的距离、20号墓与G5的距离都是。把距离不大于的类归为一类,则得到新的类,如图6.3.3中实线所圈的集合。
1701017094
1701017095
(3)仍以两个类中点的最短距离作为两类之间的距离,则现在两个类间的最小距离为2,将类的距离不大于2的类合并成新类。在图6.3.3中新的类用虚线围成。现在,除去16、21这两点外,所有的点全在这4个类中。
1701017096
1701017097
1701017098
1701017099
1701017100
▲ 图6.3.1 古墓文物按瓷器6用.3.1具数和陶俑数的分布图
1701017101
1701017102
1701017103
1701017104
1701017105
▲ 图6.3.2 古墓文物第一次聚类图
1701017106
1701017107
1701017108
1701017109
1701017110
▲ 图6.3.3 古墓文物第二次聚类图
1701017111
1701017112
1701017113
1701017114
1701017116
数学文化教程 第四节 《红楼梦》的作者是谁?数据分析的应用
1701017117
1701017118
关于中国古典名著《红楼梦》一书的作者,研究者颇多,意见也各异。但自胡适于1921年发表《红楼梦考证》后,断言“前80回为曹雪芹所著,后40回则为高鹗续成”的意见逐渐被广泛接受。这种意见对不对呢?数理语言学似乎可以帮一点忙。
1701017119
[
上一页 ]
[ :1.70101707e+09 ]
[
下一页 ]