1707606150
就像很多科幻作品中对未来的描写一样,Hal在某些方面过于高级,而在另一些方面却非常落后。虽然这部电影中的科技现在看来仍然颇具未来感,但这些技术的设计师(可能就来自IBM)并没能准确预测计算机成像技术的发展。月球飞船的飞行甲板上的导航设备,还有Hal和宇航员弗兰克·普尔玩国际象棋的屏幕,都很像20世纪80年代早期家用电脑呈现的样子。
1707606151
1707606152
从另一个方面看,Hal展现的人工智能远超2015年的技术,它可以像人一样做出回应,而且这个故事发生在2001年。Hal甚至可以表达复杂的情绪,事实上,电影中的这台计算机比其他任何角色都更情绪化。1997年,人工智能先驱马文·明斯基在一次采访中对Hal做出评价,他说类似技术“在4—400年里会成为现实”。这个陈述非常朴实,也是对未来科技的发展做出的比较正确的预测,即使他提到的最短时间有点儿过于乐观了。
1707606153
1707606154
IBM的研究员——“深蓝”团队成员默里·坎贝尔检测过HAL 9000的思考能力。“深蓝”是一台IBM制造的最早的会下国际象棋的超级计算机。这个系列最早被命名为“深思”,和《银河系漫游指南》中的超级计算机同名。“深蓝”于1995年面世,两年后,升级版的“深蓝”在一个6局的比赛中战胜了国际象棋世界冠军加里·卡斯帕罗夫(一年前,“深蓝”只赢了他一局,但输掉了整场比赛)。就像电影中的情节,Hal和宇航员弗兰克·普尔也玩国际象棋。出于某种原因,人们在相关技术还无法实现时就有对机械象棋手的憧憬。早在18世纪60年代,一个举世闻名的科幻设备面世,它就是匈牙利男爵沃尔夫冈·冯·肯佩伦设计制造的土耳其行棋傀儡。
1707606155
1707606156
这个复杂的自动化设备包括一个国际象棋棋盘,和一个与之相连的穿着华服的人偶。人偶会接受人类象棋手的挑战,并在多数情况下取胜。这个机械的土耳其行棋傀儡比肯佩伦还“长寿”,并在大西洋另一边的美国大放异彩。土耳其行棋傀儡的一生跌宕起伏,在世界上存在了80年。那时候的科技水平是不足以实现这么复杂的智能系统的,所以这个设备里面肯定还有其他机关,后来被证实确实如此。土耳其行棋傀儡里面有个小隔间,一名小个子的象棋大师藏在里面,通过一系列的控制杆,操控行棋傀儡下棋。
1707606157
1707606158
最早的有关自动化下棋设备的可行理论分别来自于现代计算机科学鼻祖查尔斯·巴比奇和艾伦·图灵。巴比奇设计了一个可以用来下棋的机械化、可编程的电脑“解析机”,但这个设备从未被制造出来;图灵编写了简单的下棋程序,但这个程序也从没有在计算机上运行过。20世纪50年代,信息理论家克劳德·香农提出了更多的想法。香农利用数学家约翰·冯·诺伊曼的极小化极大原理,为不同的走法赋予一系列不同的值,然后计算出最佳策略。香农从未编写出可行的程序,但在拍摄《2001太空漫游》时,大型计算机上已经出现了非常粗糙的下棋程序。随后在1973年,戴维·斯莱特和拉里·阿特金编出了“国际象棋4.0”,这是第一个可以在计算机上执行的、行之有效的象棋下棋程序,而且可以击败大多数普通棋手。
1707606159
1707606160
现在的计算机当然可以击败象棋大师,从“深蓝”击败加里·卡斯帕罗夫起,这一点就毋庸置疑。智能手机上的普通象棋软件也能轻松击败普通棋手,但是“深蓝”专家坎贝尔指出了一个阿瑟·克拉克和斯坦利·库布里克不太可能想到的Hal和弗兰克·普尔对弈的细节,那就是人类棋手和计算机会用迥然不同的方式下棋。人类棋手在对弈中展现出一种智慧:人类可以把规则、策略和经验整合在一起,在此基础上考虑接下来的走法,这种整体分析能力是计算机所不具备的。
1707606161
1707606162
相较之下,类似于“深蓝”的高水平计算机并没有真正意义上的智慧,计算机做的只是在短时间内得出上亿种不同的走法,为不同的走法赋值,然后考虑哪种走法最优。“深蓝”并不“理解”象棋,也不理解“兵”是什么,或者哪些才算妙招,“深蓝”只会给出后续的可能走法,并通过赋值权衡这些走法的优劣。如果计算机真的可以考虑到所有可能的结果,它看起来也许是不可战胜的。但事实上,这是不可能的,因为象棋棋子所有位置的组合数量可能比宇宙中所有原子的数量还要多。
1707606163
1707606164
通过研究电影中30秒左右的象棋对弈片段,像坎贝尔这样的专家可以看出来Hal是哪种类型的棋手——像人还是像计算机。答案是,它的思维方式更像人类,这显然可以使它轻松击败普尔。一台性能普通的个人电脑上现成的象棋软件也可以轻松做到这一点,并不需要真正的人工智能。然而,电影中的Hal还展示了类似人类的行为。导演库布里克用了1913年在德国汉堡真实发生过的棋局,原因在于,作为象棋爱好者的库布里克想让棋局更加真实。
1707606165
1707606166
尽管坎贝尔这样认为,但电影中Hal的下棋方式并不能证明它有真正的人工智能。从理论上说,这样的下棋方式可以由事先输入了上千棋谱的“深蓝”或者其他大师级的象棋软件实现。虽然某盘棋也许不在“深蓝”的数据库中,但Hal完全有可能有1913年的那局棋的相关信息,并在开局的时候利用了棋谱的走法(如果Hal连上网络就更有可能了,然而编剧克拉克和库布里克在那时绝不可能想到这一点)。但是,普尔不会按照1913年失败一方的走法一直走下去,而且在真实情况下,棋局肯定会有所改变,但最后的结果有可能不变。
1707606167
1707606168
简单地再现已经发生过的棋局并不实际,而且这也不是“深蓝”或者其他会下象棋的计算机的目标。坎贝尔指出,程序往往会认定它们的对手也会用最佳走法。可是类似的游戏也包含陷阱圈套,也就是说,普尔也许会故意选择非最佳走法。类似的陷阱走法对计算机来说很陌生,正因如此,坎贝尔说Hal是在用真正的智慧下棋,或者相比典型的象棋程序,Hal会更多地利用已有的棋谱。
1707606169
1707606170
虽然下象棋确实证明了Hal的智能,但下棋并不算是多功能计算机的一个重要功能。下象棋或许能愉悦身心,但它并不能让飞船持续飞行,也不能让船员保持健康。Hal的另一个令人印象深刻的类似人类的能力是口齿清晰的谈吐。在电影中,让配音演员读出Hal的台词固然不难;但在现实中,让机器有能力进行有意义的谈话交流何其困难。在制作电影《2001太空漫游》的20世纪60年代,我们对机器能进行智能谈话的预测太过乐观。
1707606171
1707606172
这里面有两个大的技术难关和一个小的技术难关,其中小的难关是让Hal流利地谈话。机器人式的讲话方式已经成为物理教授和媒体宠儿斯蒂芬·霍金的标志性声音,虽然现在的语音系统日新月异,但霍金还是沿用了这个有高度识别性的系统。尽管声音生成器和人类声音的区别仍然比较明显,但现在的声音生成系统完全可以清晰流畅地阅读几乎所有文本。
1707606173
1707606174
我在使用车载导航仪的时候就切身感受到了这项技术的发展。第一代系统基本上是按音节发音,第二代就好多了,但不能准确念出比较复杂的类似“赛伦塞斯特”的地名,还会把名为11A的路口念成“十一啊”。现在的第三代系统可以轻松准确地念出所有地名,而且发音与真人无异。另外,虽然《星际迷航》和《2001太空漫游》几乎是同一时间拍摄的,但是《星际迷航》里的计算机语音系统比Hal要生硬得多,即便《星际迷航》描绘的是2251年左右发生的事情。在真实的世界中,刚进入21世纪,GPS语音系统就足以和真人发声相媲美了。
1707606175
1707606176
人类对无生命物体能说话的幻想可以追溯到荷马的年代,那是中世纪最有名的谣言之一——会说话的铜人头像。铜人头像的所有者是早期的一些科学家,包括10世纪法国教皇西尔维思特二世,13世纪巴伐利亚的大阿尔伯特,和英国的罗杰·培根,他们在当时常被视为有法力的魔术师。事实上,罗杰·培根对故弄玄虚的魔术师深恶痛绝,更倾向于从科学的角度观察世界。在他死后,他的事迹一度被神化。在16世纪,他的奇闻逸事被写成故事公布于世,即《著名修士培根的历史》(The Famous Historie of Fryer Bacon)。这本书中提到了培根建造铜人头像的想法:
1707606177
1707606178
修士培根了解了英国被侵略数次的历史后,开始思考如何能保卫英国在未来不受侵略,并让自己因此永垂青史。在搜集和阅读了大量资料后,他认为保家卫国的最好办法就是制造会说话的铜人头像,保护英格兰的城墙。
1707606179
1707606180
在真实世界中实现类似的想法需要一些时间。想起来容易,但是做起来就难多了。有历史记载的最早的会说话的机器出现于1779年。一个名叫克拉施泰因的人制造了一台复杂的机器,向这台机器中吹入空气,经过类似于人类喉咙的机械结构,它就会发出类似元音的声音。12年后,设计制造土耳其行棋傀儡的沃尔夫冈·冯·肯佩伦设计出会说话的乐器。这个乐器也是利用了共振结构,可以通过手动操作让其发出元音或者辅音。这和网络视频中主人用手扒着“会说话”的狗的下巴,让狗发出“sausages”(香肠)的声音没有太大差异,肯佩伦的机器也能清晰地“说”出单词。
1707606181
1707606182
在整个19世纪和20世纪初期,改进版本的声音生成器不断推陈出新。最成功的例子是贝尔实验室于20世纪20年代推出的声码器。声码器可以用来给信息加密,或者把普通的语音压缩为特定频宽的格式。但是声码器的设计过于复杂,并没有得到实际的应用。
1707606183
1707606184
计算机除了发出声音以外还有其他潜力。在信息技术的历史上,让计算机发出声音是非常原始的想法。计算机科学家艾伦·图灵在曼彻斯特大学的计算机上首次用程序生成音乐。那台计算机连接着一个扩音器,当计算机出错的时候,一声警报会随之响起。图灵意识到,他可以对这个功能进行编程,让它产生微弱的嘀嘀声。如果一秒钟内的播放频率可以达到1 000次,嘀嘀声的不同频率就会产生不同的音调。虽然这项技术常被误认为是贝尔实验室于1957年发明的,但是第一段由计算机生成的音乐的确是出现于1950年曼彻斯特大学的“自动计算机”(ACE)上,由图灵手动编程实现的(图灵只是想用不同的音调表达不同的反馈信息)。
1707606185
1707606186
虽然在拍摄《2001太空漫游》电影的时候,已经有很多关于语音系统的理论,但却没有太多关于如何生成合成语音的研究。20世纪70年代以后,计算机越来越便宜,计算机语音系统的商业潜力也随之越来越大。从20世纪70年代英国物理学家斯蒂芬·霍金使用的声音生成系统到当代更加先进的语音系统,电子发声技术与时俱进。但要想让计算机像Hal一样与人交谈(电影中的Hal毕竟是由真人配音),我们还有很长的路要走。
1707606187
1707606188
语音合成技术固然重要,但让计算机按照声音指令做出反应在技术上更困难。我们已经实现了一些技术突破。毕竟,手机上安装的导航系统清晰易懂,语音助手Siri也能按照我们的语音命令做事。但是,手机并没有Hal那么复杂的结构,也没有Hal储存和处理大数据的能力。
1707606189
1707606190
仔细想想,Siri的交流能力其实非常有限,虽然Siri的设计者设计了一些有趣的问答。当我对着手机说“把舱门打开,Hal”(电影中,说这句话的宇航员戴夫·鲍曼直面Hal,穿着太空服但是没戴头盔)时,Siri的回答呼应了电影的场景:“没戴头盔的话,我开门你会……喘不上气的。”当我让Siri像影片结尾的Hal那样唱“黛西,黛西”时,Siri说:“你不会喜欢的。”
1707606191
1707606192
制定时间表、在网上查信息、导航、放音乐,诸如此类的功能让Siri更像一个电子秘书。Siri并不能真正和人对话,它不理解词语背后的真正含义,也不理解音调不同会产生不同的意思。虽然Siri的语音识别能力很强,但有时候它也会遇到困难。Siri不能很好地识别不标准的口音,现在的语音识别系统都不太能有效地识别英国格拉斯哥或者美国缅因等地区的口音。语音识别系统还必须有能力处理我们在平常说话时下意识使用的俚语和连音。
1707606193
1707606194
这并不是说,机器不可能理解人类的语言。下面这句话是我利用苹果电脑的内置语音系统录入的:“the factors as you can see it can slip up(就像你看到的这些因素,语音识别系统并不总是有效)。”但我实际上说的是:“But the fact is, as you can see, it can slip up(事实上,就像你看到的,语音识别系统并不总是有效)。”类似于“但是”一类的转折词会把一句话一分为二,然而,“fact is”(事实上)和“factors”(因素)在英式英语中的发音非常相似。现今的计算机语音识别系统可以达到99%的准确率,尽管如此,相较于人类,计算机在语音识别方面还是很容易出错。优化语音识别的方式之一是,让软件识别某个人的发音技巧。
1707606195
1707606196
计算机面对的一个问题是,无法理解上下文。我们在听某个人说话的时候,会习惯性地把某个词语放在整个对话的背景中去思考它的意思。有些同音字必须得借助上下文才能准确理解意思。这一点在跨语言互译方面尤其重要。如果我对着计算机阅读文字,那么我一眼看过去就能发现同音字错误;但如果我只是在听自动翻译机器的翻译,那么我不可能知道哪儿出错了。科幻作品中常常出现这样的翻译机器,比如《神秘博士》中由塔迪斯发明的宇宙通用的心电转换器。翻译必将成为计算机语言能力的重要方面。
1707606197
1707606198
Hal绝不是一个译者,但我完全相信它有翻译的能力。手机上的谷歌翻译可以或多或少地完成信息分析的工作。我对着手机说:“最近的超市在哪儿?”手机屏幕上准确地出现了这句话,或者手机会大声复述我的问题。这一切都让我清楚地知道,我会得到我想要的答案。也许这句话并不算日常用语,可是手机知道我想问什么。对话肯定更加复杂,在对话的背景下,谷歌翻译就不那么可信了。在联合国大会上,现在还不能只靠机器翻译推进多方会谈。
1707606199
[
上一页 ]
[ :1.70760615e+09 ]
[
下一页 ]