打字猴:1.705242646e+09
1705242646
1705242647 It’s a half an inch of water and you think you’re gonna drown.
1705242648
1705242649 这里的水有半英寸深,而你却认为自己就要被淹死。——出自约翰·普林的歌曲《世界转动的方法》
1705242650
1705242651 幻听的有趣之处在于,听错的内容通常比歌词本身更不合理。它们完全不符合一位理性的听者对说话者表述内容所做的一般预期。在一个案例中,有个学生固执地将骇人蓝乐队(Shocking Blue)的热门歌曲《我是你的维纳斯》(I’m your Venus)听成了“我是你的阴茎”(I’m Your Penis),他非常奇怪为什么这样的歌曲可以在电台中播放。这些幻听的句子的确符合英语的语音、语法(有时)和词语(虽然并不总是这样,例如“mondegreen”一词本身)。显然,听者被一组与语音相符的单词所引导,这些单词的组合形式或多或少地符合英语短语的结构规则,但合理性和一般预期却没有派上用场。
1705242652
1705242653 人工语音识别的研究史也提供了类似的证据。20世纪70年代,在雷伊·雷蒂(Raj Reddy)的带领下,美国卡内基梅隆大学的一组人工智能研究人员设计了一个名为“HEARSAY”的计算机程序,它能够依据人们的口头指令移动棋子。在自上而下的语音知觉理论的影响下,他们设计的程序是一个由许多“专家”子程序构成的“社区”,这些子程序相互合作,对语音信号做出最为合理的解释,其中有的子程序专门负责声学分析,有的则负责语音、词语或者语法,还有的专门负责棋子的走法,甚至下棋时的棋局策略。有一个故事是这样的:国防部的某位将军曾经莅临研究所,参观这个由国防部资助的研究项目。当他坐在棋盘前,面对连着计算机的麦克风时,科学家们都不由得捏了一把汗。结果将军清了清嗓子,程序立刻显示:“王兵进两格。”
1705242654
1705242655 本章前面提到的最新程序声龙听写更侧重于声学、语音和词法的分析,这似乎是它更为成功的原因所在。这个程序拥有一部包含单词及其音素排列的词典。为了准确预测音位规则和协同发音的影响,设计者让程序掌握了每个英语音素在任何一个可能音素之前或之后的发音情况。对于每一个单词而言,这种“音素-语境”关系构成了一个微型链条,并附带有声音单位的转换概率。这个链条是人类语音机制的原始模型。当现实中的真人使用这个程序时,链条中的概率会进行调整,以捕捉说话者的语言习惯。此外,每个单词也附带有一个概率,这取决于该单词在该种语言中的出现频率和说话者的语言习惯。在这个程序的某些版本中,每个单词的概率值会依据前面出现的单词进行调整。这是该程序唯一用到的自上而下的信息。通过这些知识,这个程序能够计算出输入语音信号的说话者最有可能说出哪个单词。即便如此,比起听力正常的普通人来,“声龙听写”还是更加依赖于预期判断。在我所观看的演示中,即便是在发音清晰无误的情况下,这个程序也要经过一番周折才能分辨“word”和“worm”,因为它一直在计算概率,期待出现频率更高的“were”的出现。
1705242656
1705242657 现在,你已经知道单个语音单位如何产生,它们在心理词典中如何表征以及在被说出之前又经过了怎样的调整和修饰了。接下来就是本章的最后部分,也是最值得探讨的一个问题:为什么英语拼写体系并不像乍看之下那么令人抓狂。
1705242658
1705242659 当然,人们对英语拼写体系的抱怨在于:虽然英语单词的拼写形式表面上与读音相符,但实际上却并非如此。有一首流传悠久的打油诗说明了这一点,其中一节内容最为典型:
1705242660
1705242661 Beware of heard, a dreadful word
1705242662
1705242663 That looks like beard and sounds like bird,
1705242664
1705242665 And dead:it’s said like bed, not bead—
1705242666
1705242667 For goodness’ sake don’t call it “deed”!
1705242668
1705242669 Watch out for meat and great and threat
1705242670
1705242671 (They rhyme with suite and straight and debt).
1705242672
1705242673 请注意“heard”,一个可怕的单词
1705242674
1705242675 它看起来像“beard”,读起来却像“bird”。
1705242676
1705242677 还有“dead”,它读起来像“bed”,而非“bead”。
1705242678
1705242679 看在老天的份上可别把它说成“deed”!
1705242680
1705242681 还要注意“meat” “great”和“threat”。
1705242682
1705242683 (它们分别与“suite” “straight” “debt”同韵)。
1705242684
1705242685 萧伯纳曾经积极地倡导英语字母的改革。他表示,英语的拼写体系完全不合逻辑,例如“fish”一词就完全可以拼成“ghoti”,因为“gh”在“tough”中发[f]的音,“o”在“women”中发[i]的音,“ti”在“nation”中发[ʃ]的音。此外我们还可以将“minute”拼成“mnomnoupte”,将“mistake”拼成“mnopspteiche”。萧伯纳在遗嘱中留下了一笔奖金,用以奖励替代性英文字母表的设计者。这套字母表的特点是,口语中的每一种声音都与表中的一个字母符号形成对应关系。他这样写道:
1705242686
1705242687 要了解使用42个音标字母所带来的年际差异……你必须计算一年有多少分钟,以及每一分钟又有多少人在书写英语单词,铸造英文字模以及生产英文打字机。当你面对这个天文数字时,就会充分地意识到,即便是一个音对应两个字母符号的拼写体系,也已经让我们在几百年的时间里耗费了无数的多余精力。一套包含42个字母的新英文字母表将为我们收回巨大的成本,每时每刻都能带来几百万倍的回报。如果这套字母表得到推广,所有用来区分“enough”“cough”和“laugh”的无谓精力都会被节省下来,简化拼写运动将变得多此一举,而经济学家和统计学家也能够动手确立一套标准规范的文字使用规则了。
1705242688
1705242689 我并不想为英语拼写体系进行辩护。虽然语言是一种本能,但书面文字却不是。历史上发明的书面文字只有少数几种,而拼音文字,即字母与声音相对应的文字,似乎只发明过一次。许多民族并没有书面语言,那些拥有书面语言的民族也大都是从发明文字的民族那里继承或借用来的。儿童必须经过艰苦的学习才能掌握读书和写字的本领,拼写知识的习得过程不存在爆炸式发展,而且有些人始终无法掌握这门技艺。由于缺乏教育而大字不识在世界上许多地方都是一种普遍现象。难语症(dyslexia),是一种被认为由于先天缺陷而导致的阅读障碍,即便在工业化社会它也是一个严重问题,其患者人数约占总人口的5%~10%。
1705242690
1705242691 但是,虽然书面文字是一种连接视觉和语言的人工装置,但它必须和语言系统形成清晰明确的对应关系,这使它也拥有了一定的逻辑规则。在所有已知的书写系统中,文字符号通常指代三种语言结构:语素、音节或音素。如美索不达米亚的楔形文字、埃及的象形文字、汉语的意音文字以及日文汉字都属于语素文字;彻罗基语、古塞浦路斯语以及日文假名都是音节文字;而现代所有的音素文字似乎都源自公元前1700年的迦南人发明的一套拼音符号。总之,没有一套书写系统的符号与实际的声音单位相对应,使之可以在示波器或者声谱图上被识别出来,例如一个在特定语音背景下的音素发音,或者一个被拦腰斩断的音节。
1705242692
1705242693 为什么没有一个书写系统符合萧伯纳的理想?为什么不能用一个符号对应一个声音?就像萧伯纳自己在其他场合所说的一句话:“生活中只有两个悲剧:一个是没有得到你想要的,另一个是得到了你想要的。”只要回想一下音位规则和协同发音的工作原理,我们就可以明白其中的道理。一套标准的萧式字母将不得不区分“write”和“ride”中的不同元音,又不得不区分“write”和“writing”中的不同辅音,另外还要用不同的拼写方式来分别代表“slapped”“sobbed”和“sorted”的过去式后缀。“Cape Cod”将失去字面上的叠声形式,“horse”(马)的拼写到了“horseshoe”(马蹄)中就要发生改变。“National Public Radio”(国家公用无线电台)的缩写将莫名其妙地变成“MPR”。我们需要用新的字母来表示“month”中的“n”和“width”中的“d”。我也许可以将“often”拼得与“orphan”不同,但我的在线好友恐怕就不会这样。反过来说,我的网友拼出的“career”也许和我拼出的“Korea”一模一样。
1705242694
1705242695 显然,字母不能也不应该和声音形成对应关系,它们最多只能对应到心理词典中的某个特定音素。实际的语音会根据不同的语境发生变化,因此,绝对的音位拼写只会模糊它们的内在身份。表层的语音可以通过音位规则进行预测,因此,我们没有必要制造出一大堆杂乱无章的符号代表实际的语音。读者只要掌握单词的基本架构,就可以在需要的时候还原它的读音。事实上,大约有84%的英语单词是可以依据规则进行预测和拼写的。此外,由于时间和地理的阻隔,方言的音位规则存在许多差异,而正是这些音位规则将心理词典中的各个条目转换为实际语音。因此,一套与心理条目而非实际语音相对应的拼写体系可以为人们所通用。而那些拼写方式颇为古怪的单词(例如“of” “people”“women” “have” “said”“do”“done”“give”)通常都是最为常用的单词,因此人们有充分的时间去记住它们。
[ 上一页 ]  [ :1.705242646e+09 ]  [ 下一页 ]