1705243050
当单词组合成短语时,情况就更为复杂了,因为每个短语都可以用不同的方式嵌入更大的短语之中。即便是在简单的语法中,一个介词短语也可以嵌入一个名词短语或动词短语。例如“discuss sex with Dick Cavett”这个存在歧义的短语,作者的本意是将介词短语“with Dick Cavett”插入动词短语中“discuss it with him”,而读者却可以认为这个介词短语是插入名词短语中“sex with him”。这种歧义是普遍现象,并非特例。在句子的每一点上,都可能需要进行几十次或者几百次检查。例如,在处理完“The plastic pencil marks…”之后,剖析器必须记住以下可能的选择:它可以是一个由四个单词构成的名词短语,比如“The plastic pencil marks were ugly”(塑料铅笔做的记号非常难看),也可以是一个由三个单词构成的名词短语再加上一个动词,比如“The plastic pencil marks easily”(塑料铅笔很容易做记号)。事实上,即便是前两个单词“The plastic”也存在着某种歧义,你可以对比一下“The plastic rose fell”(塑料的玫瑰花掉了下来)和“The plastic rose and fell”(塑料随风飘扬)的不同。
1705243051
1705243052
如果只是记录下每一点的所有可能性,计算机并不会有什么问题。它可能要花上几分钟的时间来分析一个简单的句子,或者要耗费过量的短期记忆,以至于打印出来的分析数据足以占据半个房间,但是最终来说,每个点上的大部分可能性都会被句中随后出现的信息所否定。在这种情况下,当行进到句末时,剖析器就可以生成一个能够准确揭示句子意思的树形图,就像我们所举的那些简单例句一样。但是,如果局部性的歧义无法彼此消弭,那么同一个句子就会生长出两棵平行的句法树,这就出现了模棱两可的句子,例如:
1705243053
1705243054
Ingres enjoyed painting his models nude.
1705243055
1705243056
安格尔喜欢给他的模特画裸体画。——又可理解为:安格尔喜欢光着身子给他的模特画画。
1705243057
1705243058
My son has grown another foot.
1705243059
1705243060
我儿子又长高了一英尺。——又可理解为:我儿子又长出了一只脚。
1705243061
1705243062
Visiting relatives can be boring.
1705243063
1705243064
探亲是一件无聊的事。——又可理解为:来访的亲戚很无聊。
1705243065
1705243066
Vegetarians don’t know how good meat tastes.
1705243067
1705243068
素食者不知肉味美。——又可理解为:素食者不知道好肉的味道。”
1705243069
1705243070
I saw the man with the binoculars.
1705243071
1705243072
我用双筒望远镜看见了那个人。——又可理解为:我看见了那个带双筒望远镜的人。
1705243073
1705243074
但这里存在一个问题。计算机剖析器总是太过谨慎,以致弄巧成拙。它们往往会发现一些从语法上说虽然存在歧义,但在普通人看来完全没有问题的模棱之处。哈佛大学于20世纪60年代开发了世界上最早的一个计算机剖析程序,它闹了一个著名的笑话。“Time flies like an arrow”(光阴似箭)本来是一个语意明确的句子(请暂且忽略字面意和比喻意之间的区别,这与句法无关),但出乎程序设计者意料的是,明察秋毫的计算机竟然发现它包含了五个不同的树形图!
1705243075
1705243076
Time proceeds as quickly as an arrow proceeds.
1705243077
1705243078
时间像箭一样快速行进。——句子本意
1705243079
1705243080
Measure the speed of flies in the same way that you measure the speed of an arrow.
1705243081
1705243082
测量苍蝇的速度和测量箭的速度采用的是同样的方法。
1705243083
1705243084
Measure the speed of flies in the same way that an arrow measures the speed of flies.
1705243085
1705243086
测量苍蝇的速度和箭测量苍蝇的速度采用的是同样的方法。
1705243087
1705243088
Measure the speed of flies that resemble an arrow.
1705243089
1705243090
测量像箭一样的苍蝇的速度。
1705243091
1705243092
Flies of a particular kind, time-flies, are fond of an arrow.
1705243093
1705243094
一种特别的苍蝇“时蝇”喜欢箭。
1705243095
1705243096
依据这一发现,计算机科学家们总结出一条格言:“Time flies like an arrow; fruit flies like a banana”(时蝇喜欢箭,果蝇喜欢香蕉)。我们还可以再以儿歌歌词“Mary had a little lamb”(玛丽有只小羊羔)为例,它的意思是明确的吗?如果它后面跟的是“With mint sauce”(沾着薄荷酱),它的意思就变成了“玛丽有一块羔羊肉”,如果它后面跟的是“And the doctors were surprised”(医生对此惊讶不已),它的意思就变成了“玛丽生了一只小羊羔”;如果它的后面跟的是“The tramp”,它的意思又会发生改变。此外,即便是一些看起来荒唐可笑的句子也存在一定的结构。例如我的学生安妮·森加斯所设计的这个形同呓语但却符合语法的句子:
1705243097
1705243098
Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.
1705243099
[
上一页 ]
[ :1.70524305e+09 ]
[
下一页 ]