1706580333
1706580334
20世纪70年代,马哈德万对印度河铭文语料库进行了详细分析,发现是印度河文字中最常用的字符对:在291处实例中,这个字符对有245次出现在一行的最右端。之前已经说过,是出现频次最高的印度河字符,在它出现的1395次中,有931次在一行的最左端。当然,在某些印章中,这两者肯定有不遵循上述规律的情况,但相对少见。从统计学上讲,字符对和单字符同时出现在一个印章上(比如上面那枚印文),同时不遵循规律的情况不太可能出现(也就是说,没有出现在一行的最右端且没有出现在一行的最左端),所以我们可以得出结论,印度河文字一般是从右向左读写的。但是,也有一些字符串是从左向右读的(根据马哈德万的统计,能够占总语料库的6.6%);而且不可否认的是,还有九个特例采用了牛耕式转行书写法(boustrophedon,希腊语“像牛耕地一样”),就是奇偶行交替变换书写方向。
1706580335
1706580336
在破解古文字时,最基础的工具包括清晰准确的照片语料库和线描图(以防照片不足以看清细节)、一份可靠的符号清单和一份编纂有每个符号在语料库中出现情况的用语索引。对印度河文字来说,这些工具就是马哈德万和帕尔波拉的成果,他们从20世纪70年代起进行相关研究。不过他们各自进行研究,彼此间也可称得上惺惺相惜。帕尔波拉的三大本照片集收录了印度、巴基斯坦和世界其他地方出土的印度河文字的图像,为这一文字的研究带来了彻底的改变。他1994年发表的符号清单中列出了386个字符和12个未编号的字符(而马哈德万整理出了419个),学界普遍认为这个清单是相当优秀的成果,特别是马哈德万,他认为没有任何一份符号清单比得上帕尔波拉的这份,连自己的也不行。在为异体字和尚未发现的符号留出空余后,马哈德万估计,“依照现有资料,印度河字符总数最可能有400—450个”。[15]
1706580337
1706580338
这一数值非常重要。对于音节文字系统[16](或者像拉奥认为的字母表)而言,这个数值太大了;而对于像中文那样有数千个语标的文字来说,这个数值又太小。与之最接近的要属有超过600个符号的苏美尔楔形文字和有大约800个符号的玛雅图像字符(尽管其中有许多几乎没怎么被用到过)。大部分学者由此推测,印度河文字可能是一种音意兼表的文字,就像与其同时代的西亚语言一样,但鉴别语音音节的工作进展甚微。
1706580339
1706580340
帕尔波拉同他的合作者也将这些符号标准化,并经计算机分析后编纂了用语索引,但他的这项工作并没有受到那么多关注。计算机分析原则上是个好方法,但如果符号列表存疑,就有可能得出误导性的结果。很明显,我们不能依赖电脑去分辨哪些符号是异体字(变体)、哪些符号是连字(两个或两个以上字符的组合体)。拉奥是一个极端,他无情地摒弃了异体字和连字,将符号列表简化到了只有62个符号;而韦尔斯是另一个极端,他认为一共有差不多600个符号,帕尔波拉视之为开倒车。没有人(拉奥除外)愿意看到[大量削减字符数量]给潜在信息带来的巨大减损,但字符数的上限究竟应该是多少,却没有那么明确的回答;换句话说就是,有多少可能的异体字和连字需要被识别为独立的字符,才能消除歧义。要编制一份印度河字符的列表,除了字符的外观之外几乎没有什么其他依据,而马哈德万也承认,“任何这样的方法都注定是主观而模棱两可的”。[17]
1706580341
1706580342
1706580343
1706580344
1706580345
1706580346
1706580347
1706580348
1706580349
1706580350
1706580351
不过,还是有几个可行的策略。我们知道,和这两个符号是异体字符,因为它们各自能与12种左右同样的字符串搭配,而且在这个常见的组合中可以互换,即和。而我们又可以通过位置频率分析得知,、和这三个符号很可能不是这个符号的异体字符。(符号中的小短线则可能是某种异体符,类似于法语中元音字母上的重音符号,例如é、è和ê。)这个十分常见的简单符号通常出现在铭文末尾(结束位置),而在它出现的1395次中,仅有一次出现在铭文开头(起始位置)。其他三个符号的统计数字如下:
1706580352
1706580353
1706580354
共出现177次,其中20次在起始位置;
1706580355
1706580356
1706580357
共出现35次,其中4次在起始位置;
1706580358
1706580359
1706580360
共出现51次,其中25次在起始位置。
1706580361
1706580362
1706580363
1706580364
1706580365
1706580366
就此,史蒂文·邦塔(Steven Bonta)写道:“看起来,、和与之间一定存在关联,但它们应当是不同的符号、分属不同的功能子集,而不是简简单单的异体字符。”[18]邦塔试图不对印度河语言进行任何假设,仅对印度河字符本身进行分析。但正如帕尔波拉——他认为这四个符号彼此完全独立——所说:“当一个符号出现的频次非常高时,运用上下文标准得到的结果相当有说服力,但如果符号只出现有限的几次,结论就必然是值得怀疑的。”[19]
1706580367
1706580368
辨识印度河字符中的数字格外有挑战性。铭文中出现了由个数不同的短线组成的组合(1—10条和12条短线的组合都有,唯独没有11条短线的组合),例如下页图左上角“鱼”符号周围的短线,也有长线条的组合(下页图中出现了1—7根线条的组合)。这些线条组是否代表了数字?如果是的话,短线条和长线条之间有什么区别?
1706580369
1706580370
实际情况要更复杂,因为常常有单或双短线明显不作为数字使用的场合:单短线时常出现在一种旋涡纹符号旁,而单短线和双短线也会像长线条组合那样,同时出现在同一个文本中。(短划线看上去像是被用来分隔单词,但其他证据显示它们并不是,我们一会儿将讨论。)当然,单短线和双短线也有可能既可以作为数字使用,又具有非数字的功能,就像罗马数字V、X、C和M那样,它们也是拉丁字母表中的字母。
1706580371
1706580372
1706580373
1706580374
1706580375
与此同时,12条短线的组合看上去也不太像数字。于是,马哈德万对除了1、2、12之外的其他短线组合(即3—9条线的组合)进行了频率统计,它们在语料库中出现的频次如下:
1706580376
1706580377
1706580378
1706580379
1706580380
大于7的短线组合频率出现了断崖式减少,而且长线组合中线条数也没有超过7条,因此费尔瑟韦斯认为,印度河文明采取的是8进制(而不是我们常用的10进制),达罗毗荼语中也有使用8进制的证据,提高了这一推断的可能性。但是,这又与印度河数字采用10进制的证据相抵触;图下符号代表了10、20和30并以此类推:
1706580381
1706580382
[
上一页 ]
[ :1.706580333e+09 ]
[
下一页 ]