打字猴:1.70101714e+09
1701017140 李贤平的研究使用了陈大康先生用两年半时间精心统计而得到的字频数据。这是一项十分基础的工作。以上47个虚字的出现频率,乃是统计分析的出发点。
1701017141
1701017142 然后,李贤平使用美国威斯康星大学麦迪逊分校的计算机进行统计分析,获得约300张的图表。图6.4.1是根据统计结果画出的x2距离多维点云的正视图。图中的号码表示回目,从1到120。每个点(回目)的位置由该回文字的47个虚字的频率所决定,各点之间的距离就是x2距离。
1701017143
1701017144 由图可以看出各回目之间的关系。如果从左下角到右上角画一对角线,则除了67回,1—80回在对角线之上,后40回在对角线之下。这一现象和过去红学家的判断是一样的。说明前80回和后40回是两种手笔。这个貌似平凡的结论,反衬了数学方法的有效性,也说明这47个虚字是有区别能力的。图中的这120个点能够区分开前80回和后40回,反映了《红楼梦》的特征,不是偶然地碰上的。要凑得这么好,其概率是一万亿亿亿亿分之一,事实上不可能发生。但是,更为重要的是,有许多特征过去红学家们从来没有注意到。比如,
1701017145
1701017146 *第1—5回,17,18回,78回,在图的左边,其他各回大多集中在右边。
1701017147
1701017148
1701017149
1701017150
1701017151 ▲ 图6.4.1 以47个虚字为识别特征的正视图
1701017152
1701017153 *另有第9,12—16,21—23,58,63—69(除67),74—80(除78)回,处于中间过渡地带。
1701017154
1701017155 *后40回大体可分为两类:前20回偏上,后20回偏下。
1701017156
1701017157 李贤平先生在作了大量数据分析之后,得出他自己关于《红楼梦》的新见解。其中包括了该书的作者到底是谁的判断。
1701017158
1701017159 *不能笼统认为,前80回为一人所写,后40回为另一毫不相关的人所写。因为彼此之间有交叉。
1701017160
1701017161 *前80回是曹雪芹据《石头记》写成,中间插入《风月宝鉴》,还有一些深刻的增加成分。前80回在图中的位置,可分为三部分:右边几回叙述宝黛爱情,中间几回则是取材于《风月宝鉴》的部分,左边的几回则为“梦幻”或涉贾府之外社会事件。
1701017162
1701017163 *后40回是曹雪芹亲友将曹雪芹的各种草稿经过相当长的时间整理而成。后40中:前半是宝黛爱情的继续,与前80回的宝黛爱情故事似为一人所写,在图中的距离相近;后半则是贾府衰败情景,在图中聚在右12-04086-1数学文化教程 李下角,当为另外一人所写。
1701017164
1701017165 李贤平先生的论文得出的结果,远不止这些。我们在这里引述一小部分,无非是说明数学方法的价值:它印证了红学家们的科学研究成果,同时又提供了新的视角。应该是很有说服力的。当然,数学描述只是一种参考,47个虚字作为指标,也是一种尝试。历史和文学不能简化为“虚字”统计。但是,数学的统计毕竟是客观存在,其结果是人人可以重复的。从一个特定的角度看问题,自有其特殊的价值。李贤平教授在研究工作中得到周汝昌、赵冈、周策纵等红学家的支持,表明红学家是欢迎数学家介入红学研究的。
1701017166
1701017167 在数学方法日益进步,计算机科学手段大显身手的信息时代,研究方法总要有所前进、有所突破。我们预言,数学方法在文学研究中会有更大的作为。
1701017168
1701017169
1701017170
1701017171
1701017172 数学文化教程 [:1701013750]
1701017173 数学文化教程 第五节 数据与历史:计量历史学
1701017174
1701017175 自20世纪50年代以来,国外在大力发展“计量历史学”。但在中国,这门学科却一直不能登堂入室,处于“受冷落”的地位。这种情况,应该要有所改变了。
1701017176
1701017177 历史学的研究,历来集中于政治领域。于是,历史研究方法多半会使用定性的政治分析,往往忽视甚至排斥定量的分析。然而,政治是经济的集中反映。社会的户籍、土地、雇佣、生产、贸易等经济发展的定量研究,能够更好地揭示阶级斗争、党派利益、中央与地方关系、文化艺术价值取向等深层次的问题。比如,我国历代的农民起义,都有深刻的经济背景。过去的研究也运用一些阶级剥削的史料,但总是不系统。如果有定量的分析,自然会更有说服力。
1701017178
1701017179 计量历史学的基本方法仍然是数据处理。从史料中收集样本数据,推测社会总体情况,分析社会财富的分布形态;研究某些量的相关程度,判断历史上的因果关系是否成立;构建数学动态模型,观察是否合乎历史进程。这是一门单独的学问,在此无法作全面的介绍。下面是一些例子。
1701017180
1701017181 计量历史学的早期工作,多在人口统计史、经济史等方面。一些典型的工作如“英国收入不平等的长期变化”,“《末日裁判书》中教区的土地面积”,“1860年以来英国的工资和收入”,“对19世纪工业扩张的一个解释模型:在美国生铁业中的应用”,“1840—1870年英国铁路和经济增长的关系”,“从欧洲中世纪教区登记簿研究家庭和婚姻状况”。
1701017182
1701017183 在中国,正统的“二十五史”中有专门的“食货志”,其中详细记录了历代皇朝的税赋、田亩、人口等情况;在浩如烟海的地方志以及其他历史典籍中,数量化的资料也不计其数。这些资料应该可以为中国的计量历史学提供良好的研究条件。
1701017184
1701017185 苏联科学家D.V.迪奥皮克,写了《用计量方法分析古代东方编年〈春秋〉的经验》。在文中,他将《春秋》(含《左氏》、《公羊》、《谷梁》三传)分为:外交、军事、帝王生活、内政、经济、宗教仪式、自然现象,共七部分,进行数量化研究。例如,战争事件,全书共有1万8千处提到;将其按主客体、时间、地点列出;分成早期晚期,依14个主要国家及其部族关系形成系统。通过对这些战争的数量分析,可以得出许多宏观的认识,为过去局部研究所未见。比如,牢固军事联盟早期为27组,晚期为38组;两个国家联合行动的次数,早期比晚期多11倍。这表明,早期的同盟不牢固,晚期同盟的大多数是牢固的。这反映了大量中小国家混战的旧体制逐步瓦解,出现了比较统一的社会政治综合体,即统一的社会趋势。[1]
1701017186
1701017187 用模糊数学方法来研究历史分期也是有意义的工作。例如,古代中国社会从奴隶制向封建制的过渡是我国史学界长期争论的问题。一直有“春秋战国封建制”、“汉代封建制”、“魏晋封建制”等多种观点之争。其实,从模糊数学的角度看,从奴隶制到封建制是一个长期缓变的过程。封建社会是一个“模糊集合”,其边缘是模糊的。
1701017188
1701017189 殷商时期奴隶制的隶属度是1,没有问题。魏晋以后是封建制,即隶属“奴隶制”集合的程度为0,这也没有问题。那么在春秋至魏几百年间,用一个隶属函数来描写不是很好吗?这当然要从“殉葬制度”、“农奴数目”、“生产水平”等多种因素加以测定。这是一个很复杂的工作,需要很多的历史资料才能完成。
[ 上一页 ]  [ :1.70101714e+09 ]  [ 下一页 ]