打字猴:1.705242856e+09
1705242856
1705242857
1705242858
1705242859
1705242860 和其他词语一样,限定词只是某个相关短语的组成部分。通过核查限定词的用法规则,剖析器可以辨认出这个短语。根据用法规则,限定词是用来构成名词短语(NP)的。这棵树因此继续生长:
1705242861
1705242862
1705242863
1705242864
1705242865 大脑必须记住这个悬垂结构。剖析器明白,“the”这个单词只是名词短语的组成部分,如果要使这个名词短语完整起来,就必须找到其他一些词语来填补剩下的部分——在这个例子中,至少需要一个名词。
1705242866
1705242867 与此同时,这棵树还在继续生长,因为名词短语不能单独存在。根据名词短语的用法规则,剖析器面临着几种选择:这个刚刚“长出”的名词短语可以是句子的一部分,也可以是动词短语的一部分,还可以是介词短语的一部分。不过,如果我们从“根部”入手,这个问题就好解决了:所有的单词和短语最终必须装入一个句子(S)之中,而所有的句子又必须以名词短语开头。因此,如果想让这棵树继续生长,就有必要动用一下句法规则:
1705242868
1705242869
1705242870
1705242871
1705242872 现在,剖析器将两个有待补齐的分枝暂存到记忆之中:一个是缺少名词(N)的名词短语,一个是缺少动词短语(VP)的句子。
1705242873
1705242874 在这棵树中,树枝N下面空空荡荡,这意味着接下来出现的应该是一个名词。当句子中的第二个单词“dog”映入眼帘时,这个预测就得到了验证,因为根据规则的核实,“dog”正属于名词的范畴。就这样,“dog”一词融入树中,与“the”一起构成了一个完整的名词短语:
1705242875
1705242876
1705242877
1705242878
1705242879 现在剖析器可以将名词短语从记忆中清除了,它需要解决的是一个不完整的句子(S)。
1705242880
1705242881 到目前为止,我们已经可以推测出这个句子所要表达的部分意思。在名词短语中,名词是整个短语的中心语,它是短语所要表达的主要内容,而短语中的其他部分都是这个中心语的扮演角色。根据心理词典中关于“dog”和“the”的定义,剖析器可以解读出这个短语的含义:一只已经提到过的狗。
1705242882
1705242883 接下来的单词是“likes”,很明显,这是一个动词(V)。既然出现了一个动词,那么就必然存在一个动词短语,而这恰好是剖析器所预料的结果,因此它立即被拼接到句子之中。对于动词短语而言,仅有一个动词还不够,它还需要一个名词短语作为自己的宾语。剖析器由此做出预测:接下来应该出现一个名词短语。
1705242884
1705242885
1705242886
1705242887
1705242888 下一个出现的是名词“ice cream”,它正好可以作为一个名词短语来填补树枝NP下出现的空缺。就这样,剖析器完成了最后一块拼图:
1705242889
1705242890
1705242891
1705242892
1705242893 “ice cream”一词完成了建构名词短语的任务,因此它不必再保存于记忆之中。名词短语完成了建构动词短语的任务,所以它也可以被丢到一边,最终由动词短语将这个不完整的句子补齐了。当记忆中所有不完整的分枝都被清理干净后,一切都变得豁然开朗:我们听到的是一个要素齐全、合乎语法的句子。
1705242894
1705242895 当剖析器将一个个分枝拼接起来的时候,它也在解读这个句子的意思。剖析器所利用的工具是心理词典和各种搭配规则。动词是动词短语的中心语,所以句中的动词短语所强调的是“likes”。在动词短语中,名词短语是动词的宾语,根据心理词典对“likes”一词的解释,它的宾语是指被喜欢的对象。因此,句中的动词短语所表达的意思是“喜欢冰激凌”。位于时态动词前面的名词短语是这个动词的主语,根据我们的心理词典,“likes”一词的主语是动作的执行者。通过将主语“The dog”和动词短语“likes ice cream”的语义综合起来,剖析器就可以确定这个句子的意思:一只先前已经提到过的犬科动物喜欢上了一种冰冻的甜品。
1705242896
1705242897
1705242898
1705242899
1705242900 语言本能:人类语言进化的奥秘 [:1705239631]
1705242901 语言本能:人类语言进化的奥秘 记忆负担轻的语言,才是好语言
1705242902
1705242903 可是,为什么计算机很难做到这一点呢?另外,当人们碰到一些官僚文字或者文笔极差的文章时,为什么会觉得难以理解呢?我们可以假设自己就是一个句法剖析器,在对一个句子进行解剖分析的时候,我们就像计算机一样,面临着两项工作:一个是记忆,我们不得不记住那些尚待完成的悬垂短语,这些短语都必须由特定的单词来填补;另一个是决策,如果某个单词或短语同时具有两种不同的用法,我们就必须从中做出选择,以便准确地画出下一个分枝。我们前面曾提到人工智能的“第一定律”:困难的工作非常简单,而简单的工作却无比困难。事实证明,记忆的工作对计算机而言非常简单,对人类来说则相当困难,而决策的工作对人类来说易如反掌(只要句子本身的结构没有问题),但却足以让计算机望而却步。
1705242904
1705242905 句法剖析涉及大量的记忆工作,但其中最常见的是记住那些不完整的短语,即已经剖析过的句子成分。为了完成这项任务,计算机必须预留出一组存储单元,它通常被称为“栈区”(stack)。只有这样,一个句法剖析器才有可能利用短语结构规则来进行工作,而不至沦为一个字串处理装置。人类也必须调动自己的短期记忆来贮存悬垂短语,但短期记忆偏偏是人类信息处理的主要瓶颈。我们的大脑一次只能记住少量的事物,多则9个,少则5个,一般在7个左右,而且这些事物很快就会变得模糊起来,或者被新的记忆所覆盖。下面这些例句会让你明白,如果一个悬垂短语在记忆中保留得太久,将会造成什么样的后果:
[ 上一页 ]  [ :1.705242856e+09 ]  [ 下一页 ]