1705242764
1705242765
裁判:你的问题让我感到莫名其妙……诗人的“天马行空”和我们大多数人的“不着边际”并不是一回事。
1705242766
1705242767
1705242768
1705242769
计算机:你怎么知道我的问题让你感到莫名其妙……诗人的“天马行空”和我们大多数人的“不着边际”并不是一回事?
1705242770
1705242771
1705242772
1705242773
实际上,这位程序设计者只不过是将计算机科学家约瑟夫·魏茨鲍姆(Joseph Weizenbaum)1965年发明的一项技术简单地更新了一下。魏茨鲍姆曾经编写了一个非常简陋的程序,并给它取名为“伊丽莎”(Eliza),这个名字源自萧伯纳《卖花女》中的女主人公。这个程序能在输入的语句中找到几个关键词,然后从存储列表中检索出一个现成的回复,并将输入语句中的部分内容插入这个回复之中,再稍微进行一些替换,例如将“你是”换成“我是”。如此一来,这个程序便可以初步模拟人类的谈话。这个程序还有一个名为“医生”(doctor)的版本,它模拟的是一位罗杰斯学派的心理治疗师,根据卡尔·罗杰斯(Carl Rogers)的理论,面对患者的陈述,治疗师应该进行回问,以便引起患者自己的思考。这个程序的一个版本后来被睿侠电子便利店(Radio Shack)作为计算机游戏出售于世,而另一个版本则附带于我所使用的文字处理程序GNU Emacs之中。它的说明书这样写道:“如果Emacs的表现非常糟糕,以上所述的各种方法都无法解决您的问题,Emacs仍然可以帮到您——请输入‘M-x doctor RET’指令。”以下是一段典型的对话:
1705242774
1705242775
用户:我最近一直很抑郁。
1705242776
1705242777
计算机:你经常感到抑郁吗?
1705242778
1705242779
1705242780
1705242781
用户:是的,几乎每时每刻。
1705242782
1705242783
1705242784
1705242785
计算机:你为什么说“是的,几乎每时每刻”呢?
1705242786
1705242787
1705242788
1705242789
用户:我现在就想哭。
1705242790
1705242791
1705242792
1705242793
计算机:你是因为想哭才来找我的吗?
1705242794
1705242795
1705242796
1705242797
有一天,魏茨鲍姆发现自己的秘书居然待坐在显示器前,向计算机程序吐露自己的心扉,这让他感到莫名的恐惧。
1705242798
1705242799
大多数计算机科学家对洛伯纳大奖赛嗤之以鼻。在他们看来,它只是一个无聊的宣传噱头,这种比赛只能糊弄一些业余人士,而无法让计算机真正掌握人类的语言(因为人工智能的研究人员和精通语言问题的专家学者都被排除于裁判之列,而他们本身也不屑于参加这样的比赛,报名参赛的都是一些计算机爱好者)。这就好比为了推动生物学的研究而设立一个大奖,看看谁能做出一朵最能以假乱真的绢花,或者说在好莱坞的拍摄场地模拟一番登陆月球的情景,以此实现所谓的太空计划。目前,学者们对计算机的语言理解系统已经有了深入的研究,但没有哪位严肃的工程学家敢预言它很快就会达到人类的水平。
1705242800
1705242801
事实上,在科学家看来,人类对句子的理解能力实在是超乎想象的。人们不但可以完成这个极其复杂的任务,而且无须花费太多的时间。接收与理解往往“同步进行”,听话者的思路可以跟上说话者的语速,而不必等到整个谈话结束之后,再回过头来对听到的内容进行解读,就像评论家创作书评那样。一句话从说话者嘴里说出,到听者理解这句话的意思,二者的间隔短得几乎可以忽略不计:大约一两个音节的长度,也就1/2秒左右的时间。还有一些人能够更为快速地理解、跟读他人所说的内容,时间间隔只有1/4秒。
1705242802
1705242803
对这种理解能力的研究探析,不但可以帮助我们制造能够与人类交流的机器,还有许多其他的实际用途。人们对句子的理解又快又准,但并非完美无缺。无论是一次谈话还是一篇文章,它的语法结构都必须符合一定的规则,我们才能明白其中的含义,否则就会出现理解上的障碍、反复和歧义。在本章中,我们将探讨语言的理解问题,看看哪一种句子能够被读者充分理解。这样一来,我们就可以制订出一套有关如何清晰写作的行文规范,对于那些指导人们进行科学写作的手册指南而言,例如约瑟夫·威廉姆斯(Joseph Williams)1990年所撰的《风格:清晰、优雅地写作》(Style: Toward Clarity and Grace),本章的诸多发现将对它们提供重要的参考。
1705242804
1705242805
另一个实际的用途则与法律有关。在审判实践中,法官常常会遇到一个难题,他们需要判断一个人是否能够理解某些含糊其词的文字,比如那些浏览商业合同的客户、听取法官指示的陪审员,或者面对诽谤文字的普通公民。研究者通过各种实验,已经揭示出人们的许多理解习惯。在《法官语言》(The Language of Judges)一书中,语言学家、律师劳伦斯·索兰(Lawrence Solan)解释了语言和法律的关系。这本书写于1993年,内容十分有趣,我们下面还会提到它。
1705242806
1705242807
句法剖析器,理解语言的最基本工具
1705242808
1705242809
我们是如何理解一个句子的呢?第一步是进行“句法剖析”(parse)。这并不是指你上小学时所做过的那些令人生厌的语法练习。对于这种练习,戴夫·巴里(Dave Barry)在《请问语言先生》(Ask Mr. Language Person)一书中有过一番调侃:
1705242810
1705242811
问:请解释一下如何用图解法分析句子。
1705242812
1705242813
答: 首先,找个像烫衣板那样的干净平台,把要图解的句子放在上面。然后用一支削尖的铅笔或者小刀片固定句子的“谓语”,它表明的是动作发生的地方。如果把一个句子比作一条鱼,那么“谓语”通常就位于鱼鳃的正后方。例如,在“拉蒙特从不会咬护林员”这句话中,事发地很有可能是森林,所以你画的图就应该像一棵小树,它伸出的树枝可以用来标识句子的各个组成部分,例如各种动名词、谚语或者附加词等。
[
上一页 ]
[ :1.705242764e+09 ]
[
下一页 ]