打字猴:1.701017078e+09
1701017078
1701017079
1701017080 此处,x1和x2可以看作平面直角坐标系中点的两个坐标,每个古墓可以用该坐标平面上的一个点来表示,得图6.3.1。我们采用通常平面上点的距离作为对应的古墓与古墓间的差别。
1701017081
1701017082 (1)从图和表都可看出,两个古墓的最小距离是1,其中下面几组古墓之间的距离都是1:
1701017083
1701017084 1号与2号,5号与6号,11号与5号,7号与9号,8号与9号,12号与13号,17号与18号,17号与19号。
1701017085
1701017086 把距离为1的点合成一类,就得到新的类,把这些新类用实线圈起来,如图6.3.2,分别记为G1,G2,…,G5。
1701017087
1701017088
1701017089
1701017090
1701017091
1701017092
1701017093 (2)以两个类中点的最短距离作为两个类的类间的距离。可计算得目前两个类间的最短距离为。此处4号墓与G2中的11号墓距离为,因而4号墓与G2的距离为。同样,10号墓与G3的距离、20号墓与G5的距离都是。把距离不大于的类归为一类,则得到新的类,如图6.3.3中实线所圈的集合。
1701017094
1701017095 (3)仍以两个类中点的最短距离作为两类之间的距离,则现在两个类间的最小距离为2,将类的距离不大于2的类合并成新类。在图6.3.3中新的类用虚线围成。现在,除去16、21这两点外,所有的点全在这4个类中。
1701017096
1701017097
1701017098
1701017099
1701017100 ▲ 图6.3.1 古墓文物按瓷器6用.3.1具数和陶俑数的分布图
1701017101
1701017102
1701017103
1701017104
1701017105 ▲ 图6.3.2 古墓文物第一次聚类图
1701017106
1701017107
1701017108
1701017109
1701017110 ▲ 图6.3.3 古墓文物第二次聚类图
1701017111
1701017112
1701017113
1701017114
1701017115 数学文化教程 [:1701013749]
1701017116 数学文化教程 第四节 《红楼梦》的作者是谁?数据分析的应用
1701017117
1701017118 关于中国古典名著《红楼梦》一书的作者,研究者颇多,意见也各异。但自胡适于1921年发表《红楼梦考证》后,断言“前80回为曹雪芹所著,后40回则为高鹗续成”的意见逐渐被广泛接受。这种意见对不对呢?数理语言学似乎可以帮一点忙。
1701017119
1701017120 用数学方法判断一部文学作品的作者,在国外早有先例。当年,苏联肖洛霍夫是否创作了《静静的顿河》,也曾经闹得满城风雨。最后据说是用了统计方法,才确认了肖洛霍夫的作者地位。
1701017121
1701017122 1987年,复旦大学数学系的数理统计专家李贤平教授,发表《〈红楼梦〉成书新说》的论文(见《复旦学报》社科版,1987年第五期)。作者用现代数学方法,以电子计算机为工具,对《红楼梦》的语言作了统计分析,获得了大量的新发现。他的做法是:
1701017123
1701017124 (1)将120回看做一个整体,不再先验地分前80回和后40回。以平等对待的客观态度,用统计数据来下判断。
1701017125
1701017126 (2)从统计语言学的角度建立识别特征。主要用47个虚字的出现频率,有时也用到句长分布。47个虚字是
1701017127
[ 上一页 ]  [ :1.701017078e+09 ]  [ 下一页 ]