打字猴:1.70524303e+09
1705243030 The woman who the janitor we just hired hit on is very pretty.
1705243031
1705243032 我们刚刚雇用的看门人无意中发现的女人长得非常漂亮。
1705243033
1705243034 真正困扰人类剖析器的不是记忆量的大小,而是记忆的方式:我们的记忆需要将某一特定类型的短语储存起来,以便回过头来进行分析;与此同时,它又必须分析另一个同样类型的短语。以上那些递归结构的例句都有一个特点:一个关系从句坐落于另一个同样类型的关系从句之中,或者说一个“if…then”的句子坐落于另一个“if…then”的句子之中。似乎人类的句法剖析器在解读句子的过程中,并不是依次列出一份所需完成的短语清单,而是开设一份总检查表,为每个短语类型标记一个号码。当某个短语类型需要记住两次以上时——以便这个短语(the cat that…)和坐落于它内部的相同类型的短语(the rat that…)能够依次完成——检查表上却没有足够的空间同时标记两个号码,因此这些短语也就变得难以理解。
1705243035
1705243036 在记忆方面,人类无法与计算机相比;但在决策方面,人类却更胜一筹。我们上面所涉及的都是简单的语法和句子,其中的每个单词在心理词典中都只有一个词条,也只有一条用法规则。但是,如果你打开一本词典,就会发现许多名词都拥有二级词条,可以作为动词使用,反之亦然。例如“dog”的二级词条是动词,表示“纠缠、尾随”的意思,如“Scandals dogged the administration all year”(政府全年都被丑闻缠身)。同样,在日常生活中,“hot dog”(热狗)不仅是个名词,还是一个动词,表示“炫耀、卖弄”的意思。其实,简单语法中的每个动词都可以当作名词,因为英语使用者常常会说“cheap eats”(小吃)、“his likes and dislikes”(个人好恶)、“taking a few bites”(随便吃几口)。即便是“one dog”中的限定词“one”也可能作为一个名词出现,例如尼克松当年的竞选口号“Nixon’s the one”(尼克松是救世主)。
1705243037
1705243038 这种局部性的歧义使得剖析器在行进途中不得不面对大量令人迷惑的岔道。举例而言,当它在句子开头碰到“one”这个单词时,它不能简单地画出下面这个分枝:
1705243039
1705243040
1705243041
1705243042
1705243043 它必须同时记住以下分枝:
1705243044
1705243045
1705243046
1705243047
1705243048 同样,当它经过“dog”一词时,也必须匆忙记录下两个相对的分枝:一个作名词,一个作动词。如果要处理“one dog”这两个单词,剖析器需要检查四种可能的情况:“限定词-名词”“限定词-动词”“名词-名词”“名词-动词”。当然,“限定词-动词”这种情况可以忽略不计,因为它不符合语法规则,但剖析器依然需要进行检查。
1705243049
1705243050 当单词组合成短语时,情况就更为复杂了,因为每个短语都可以用不同的方式嵌入更大的短语之中。即便是在简单的语法中,一个介词短语也可以嵌入一个名词短语或动词短语。例如“discuss sex with Dick Cavett”这个存在歧义的短语,作者的本意是将介词短语“with Dick Cavett”插入动词短语中“discuss it with him”,而读者却可以认为这个介词短语是插入名词短语中“sex with him”。这种歧义是普遍现象,并非特例。在句子的每一点上,都可能需要进行几十次或者几百次检查。例如,在处理完“The plastic pencil marks…”之后,剖析器必须记住以下可能的选择:它可以是一个由四个单词构成的名词短语,比如“The plastic pencil marks were ugly”(塑料铅笔做的记号非常难看),也可以是一个由三个单词构成的名词短语再加上一个动词,比如“The plastic pencil marks easily”(塑料铅笔很容易做记号)。事实上,即便是前两个单词“The plastic”也存在着某种歧义,你可以对比一下“The plastic rose fell”(塑料的玫瑰花掉了下来)和“The plastic rose and fell”(塑料随风飘扬)的不同。
1705243051
1705243052 如果只是记录下每一点的所有可能性,计算机并不会有什么问题。它可能要花上几分钟的时间来分析一个简单的句子,或者要耗费过量的短期记忆,以至于打印出来的分析数据足以占据半个房间,但是最终来说,每个点上的大部分可能性都会被句中随后出现的信息所否定。在这种情况下,当行进到句末时,剖析器就可以生成一个能够准确揭示句子意思的树形图,就像我们所举的那些简单例句一样。但是,如果局部性的歧义无法彼此消弭,那么同一个句子就会生长出两棵平行的句法树,这就出现了模棱两可的句子,例如:
1705243053
1705243054 Ingres enjoyed painting his models nude.
1705243055
1705243056 安格尔喜欢给他的模特画裸体画。——又可理解为:安格尔喜欢光着身子给他的模特画画。
1705243057
1705243058 My son has grown another foot.
1705243059
1705243060 我儿子又长高了一英尺。——又可理解为:我儿子又长出了一只脚。
1705243061
1705243062 Visiting relatives can be boring.
1705243063
1705243064 探亲是一件无聊的事。——又可理解为:来访的亲戚很无聊。
1705243065
1705243066 Vegetarians don’t know how good meat tastes.
1705243067
1705243068 素食者不知肉味美。——又可理解为:素食者不知道好肉的味道。”
1705243069
1705243070 I saw the man with the binoculars.
1705243071
1705243072 我用双筒望远镜看见了那个人。——又可理解为:我看见了那个带双筒望远镜的人。
1705243073
1705243074 但这里存在一个问题。计算机剖析器总是太过谨慎,以致弄巧成拙。它们往往会发现一些从语法上说虽然存在歧义,但在普通人看来完全没有问题的模棱之处。哈佛大学于20世纪60年代开发了世界上最早的一个计算机剖析程序,它闹了一个著名的笑话。“Time flies like an arrow”(光阴似箭)本来是一个语意明确的句子(请暂且忽略字面意和比喻意之间的区别,这与句法无关),但出乎程序设计者意料的是,明察秋毫的计算机竟然发现它包含了五个不同的树形图!
1705243075
1705243076 Time proceeds as quickly as an arrow proceeds.
1705243077
1705243078 时间像箭一样快速行进。——句子本意
1705243079
[ 上一页 ]  [ :1.70524303e+09 ]  [ 下一页 ]