打字猴:1.705242468e+09
1705242468
1705242469
1705242470
1705242471 “slapped”中的[t]音与“slapped”中的[p]音形成了匹配关系,是因为它们都是清音。它们在心理词典中被视作同一个特征,从而将两个音段联系起来。这种情形在其他语言中也很常见。例如清浊、元音音质、语调等特征可以为单词中的各个音素提供一种横向联系,仿佛每个特征都住在自己的“音层”(tier)中,而不是与某个单独的音素拴在一起。
1705242472
1705242473 可见,音位规则关注的是特征,而不是音素。它们调整的也是特征,而不是音素。前文说过,正是一类类特征的排列组合,才形成了语言中的各种音素。这些事实表明,语音的原子是特征,而不是音素,这些特征存储于大脑之中,成为大脑的操作对象。音素只不过是一组特征的集合。因此,即便是在最小的语言单位——特征的层面上,语言也是以组合系统的方式进行工作的。
1705242474
1705242475 所有的语言都有自己的音位规则,可它们又有什么用呢?你或许已经注意到,这些规则可以使发音变得更加容易。对两个元音之间的[t]或[d]进行闪音处理,可以帮助我们更快地发音,而不必让舌尖为了积累足够的气压而长时间地保持不动。将单词词尾的清音特征作用于后缀之上,可以使说话者不必先关闭喉头发词尾的音,再打开喉头发后缀的音。乍看之下,音位规则仅仅是一组偷懒的方法。从这个角度出发,人们很容易注意到其他方言中的语音调整现象,并将这种调整归结为说话者的懒惰。这种心理非常普遍,无论是英国人还是美国人中。例如萧伯纳写道:
1705242476
1705242477 英国人不尊重他们的语音,不肯教他们的孩子好好说它。他们无法正确地拼读,因为他们拥有的是一套古老的外来字母系统,其中只有辅音(而且不是所有辅音)有一致的发音规则,因此只要一个英国人开口说话,就注定要遭到其他英国人的鄙视。
1705242478
1705242479 莱德勒在《如何听懂美国人的含混口音》(Howta Reckanize American Slurvian)中写道:
1705242480
1705242481 一直以来,语言爱好者都在为美国人说话时的拙劣发音而伤神。那些听觉敏锐的人不得不承受极大的痛苦和愤懑,听着人们把“government”念成“guvmint”,把“accessories”念成“assessories”。事实上,无论走到哪里,我们都受到含混不清的口音的围攻。
1705242482
1705242483 但是,如果这些悲愤者的耳朵能够再敏锐一些,他们或许就能注意到这样一个事实:没有任何一种方言允许人们在发音上敷衍了事。音位规则一手提供方便,一手又把它拿走。一个乡下人也许会因为将“Nothin’ doin’”中的“g”音省略而遭到嘲笑,但他却很有可能清晰地发出“pólice and accidént”中的元音[ə],而那些自以为高人一等的知识分子却会把它弱化为中性元音[uh]。当布鲁克林道奇队的投手韦特·霍伊特(Waite Hoyt)被球击中的时候,一位球迷在看台上大声叫道:“Hurt’s hoit!”(受伤了霍伊特)。喜欢“pahk their cah in Hahvahd Yahd”(即“park their car in Harvard Yard”,把车停在哈佛校园)的波士顿人也喜欢把自己的女儿叫作“Sheiler”(Sheila)和“Linder”(Linda)。1992年,马萨诸塞州韦斯特菲尔德市(Westfield)的居民提交了一份法案,禁止本市学校雇用任何“带有口音”的外来教师——这可是千真万确之事。一位具有怀疑精神的女士曾给《波士顿环球报》(Boston Globe)写信,说自己当年的老师—— 一位土生土长的新英格兰人曾用“orphan”和“often”来解释“同音词”,另一位搞笑的读者也说自己当年因为将“cuh-rée-uh”拼写成“Korea”,将“cuh-rée-ur”拼写念成“career”而让老师气愤不已。不过,很快,这个提议就被撤回了。
1705242484
1705242485 我们有充足的理由说明为什么音位规则要对发音上的“懒惰现象”实施严格监管,为什么所有的方言都不允许它的使用者随心所欲地偷工减料。说话者的每一次偷工减料都会让听者付出脑力上的代价。如果一个社会由懒惰的说话者构成,那么它也必然是一个勤奋的听者社会。如果这个社会由说话者说了算,那么所有的音位规则都将被取消;但如果由听者说了算,语音就会走上相反的道路,它会迫使说话者在发音时严格遵守音位规则,以扩大易混音素的听觉差异。事实上,许多音位规则也正是这么做的。例如英语中有这样一条规则:一个人在发[sh]音时必须将双唇撮圆,而在发[s]音时则不必如此。这个额外动作的好处是:撮起的双唇拉长了共振腔的长度,从而加强了将[sh]和[s]区分开的低频噪声,听者也就能够更加容易地识别出[sh]音。虽然每个说话者同时也是一个听者,但人性的伪善使我们不敢贸然依靠说话者的远见和体贴。相反,语言社区的每个成员都宁愿接受一套相对严格、有张有弛的音位规则,并在牙牙学语的孩提时代就已掌握这套规则。
1705242486
1705242487 即便音位规则并未扩大易混音素的听觉差异,它也可以给听者带来好处。它使得语音模式具有可预测性,从而增加了语言的“羡余性”(redundancy)。据估 计,就携带的信息量而言,英语文本的实际长度是其所需长度的2~4倍。例如,本书在我的计算机磁盘中占了900 000个字符,但我的压缩软件可以利用字母排列顺序的羡余性,将其压缩到400 000个字符,而不含英语文本的计算机文件则无法压缩到这个程度。逻辑学家奎因解释了为何许多系统都具有羡余性特征:
1705242488
1705242489 这是对最低需求的一种明智超越。这是一座设计精良的大桥在承受始料未及的压力时依然屹立不倒的原因所在。这是未雨绸缪的保护之策。这也是为什么我们在填写邮寄地址时尽管已注明邮政编码,却仍要写下城市和州名的原因,否则的话,一旦邮政编码中的某个数字写得不太清楚,就可能搞砸一切……据传说,有个王国曾经因为缺少一个马掌钉而灭亡。羡余性正是我们防范这种不稳定因素的手段。
1705242490
1705242491 多亏了语言的羡余性,即便将句子中的元音全部替换成“x”,你也能读懂我所写的内容(yxx cxn xndxrstxnd whxt x xm wrxtxng xvsn xf x rxplxcx xll thx vxwxls wxth xn“x”);而如果把句中的元音都去掉的话,辨别起来就更难一些(t gts lttl hrdr f y dn’t vn kn whr th vwls r)。在倾听别人说话的时候,音位规则所提供的羡余性能够补偿声波上的模棱两可之处。例如,当听者听到“thisrip”这个音时,他知道这一定是“this rip”而不是“the srip”,因为在英语中,[sr]这个辅音连缀是不合法的。
1705242492
1705242493
1705242494
1705242495
1705242496 语言本能:人类语言进化的奥秘 [:1705239628]
1705242497 语言本能:人类语言进化的奥秘 为什么语音识别如此之难
1705242498
1705242499 那么,为什么我们已经可以将人送上月球,却制造不出一台具有听读功能的计算机呢?根据我前面的解释,每个音素都拥有一个专有的听觉签名:对元音来说是一组共振,对擦音来说是一段噪声,对塞音来说是一个气流的爆破过程。按部就班的音位规则以可预测的方式对音素的排列次序进行规范调整。假设我们可以循着这些规则原路返回,想必就可以回到最初的起点。
1705242500
1705242501 语音识别之所以如此困难,是因为人类的大脑和口头之间存在许多龃龉之处。世界上没有两个人的声音是相同的,无论是声道形状还是发音习惯,都存在个体差异。说话的语气和速度也会影响音素的听觉效果。在快速交谈的时候,许多音素会被直接略过。
1705242502
1705242503 但是,为什么我们目前还无法制造出一台电子速记设备?主要原因就是一种肌肉控制现象的存在:“协同发音”(coarticulation)。假设在你面前放一个碟子,在碟子旁边30厘米的地方放一个咖啡杯。现在要求你快速地触碰一下碟子,然后再拿起咖啡杯。显然,你会选择触碰离咖啡杯最近的碟子边缘,而不会触碰碟子的中心。而且,在你的手伸向碟子的同时,你的手指就已经做出了触碰碟子边缘的姿势。这一组平稳、自然的重叠动作是运动控制的一个普遍现象,它缩小了身体移动的必要力量,降低了关节的劳损度。在这一点上,舌头与喉头也不例外。当我们要发一个音素的音时,我们的舌头无法瞬间判断出自己应该抵达的目标位置。舌头是一块分量不轻的肉,它的移动需要一定的时间。因此在舌头移动的过程中,我们的大脑就已经通过轨道的计算,预测出了它的下一个位置,正如触碰碟子、拿起咖啡杯的操作一样。在条件允许的范围内,我们总是将舌头放在离下一个音素的发音位置最近的地方。如果当前的音素并没有要求发音器官必须处于怎样的状态,我们就会预测下一个音素的发音位置,并将发音器官提前摆好。但大多数人根本察觉不到这种调整,除非被有意提醒。请念一下“Cape Cod”(科德角),如果不是本书提醒,你可能永远都不会注意到这一点:在发这两个[k]音时,舌面的位置其实不同。此外,“horseshoe”中的第一个[s]音变成了[sh]音,“NPR”中的[n]音变成了[m]音,“month”和“width”中的[n]音和[d]音的发音位置是齿部,而不是通常的齿龈。
1705242504
1705242505 由于声波对共振腔的形状极其敏感,因此这种协同发音会对语音造成严重干扰。每个音素的语音特征都染上了前后音素的色彩,有时在其他音素的组合下甚至会丧失自己的语音特征。这就是为什么我们无法将录有“cat”一词的磁带进行剪裁,从中找出包含一个单独的[k]音的片段的原因。当你一路剪下去时,你得到的片段最终会从一个类似[ka]的音演变为类似一声“喳喳”声或口哨的声音。从理论上说,语流中的音素叠加现象对语音识别器来说是一个福音。正如我在本章开头部分提到的,辅音和元音的信号被同时传递出来,这极大地提高了音素的发音速度。此外,我们可以为每个给定的音素找到大量羡余的声音线索。但是,只有高度发达的语音识别器才能享受这一便利,这个识别器必须对声道的混音机制有所了解。
1705242506
1705242507 显然,人类的大脑就是这样一台高度发达的语音识别器,但没有人知道它是如何做到的。出于这个原因,研究语音知觉的心理学家和设计语音识别装置的工程师密切关注着彼此的研究工作。语音识别的难度大得惊人,从理论上说,我们或许只能找到仅有的几条解决方案。在这种情况下,大脑的工作原理可以为语音识别装置的设计提供最好的参考,反过来说,一台语音识别装置也可以帮助我们了解大脑的工作原理。
1705242508
1705242509 在言语研究的早期阶段,人们已经发现听者能够预测说话者可能要说的内容。这种预测可以缩小听者对语音信号的分析范围。我们已经注意到,音位规则能够提供一种可资利用的羡余度,但人类的能力并非仅限于此。心理学家乔治·米勒曾用磁带播放出一些夹杂着背景噪声的句子,并要求被试复述他们听到的内容。其中一些句子符合英语语法且合乎情理:
1705242510
1705242511 Furry wildcats fight furious battles.
1705242512
1705242513 毛茸茸的野猫们发生了激烈的搏斗。
1705242514
1705242515 Respectable jewelers give accurate appraisals.
1705242516
1705242517 受人尊敬的珠宝商给出了准确的鉴定。
[ 上一页 ]  [ :1.705242468e+09 ]  [ 下一页 ]