1704605207
技术陷阱:从工业革命到AI时代,技术创新下的资本、劳动与权力 [
:1704601988]
1704605208
技术陷阱:从工业革命到AI时代,技术创新下的资本、劳动与权力 第十二章 人工智能
1704605209
1704605210
一场包括了更大的数据库、摩尔定律、灵巧的算法在内的完美的进步风暴,为人工智能最近的许多进展铺平了道路。最重要的是在过去的几十年里,人工智能使得自动化超出了常规工作的范围,延伸到了一些全新的、意想不到的领域。在过去基于规则的计算时代,自动化受限于必须由程序员做出明确规定的演绎指令。人工智能发现了将人类难以表达或解释的事情进行自动化处理的方式,比如怎样开车或翻译一篇新闻报道,这让我们解决了(或至少部分解决了)波兰尼悖论(见第九章)。 1 最根本的区别在于,我们现在不是通过编写一组指令来实现任务的自动化,我们给计算机编写程序是让它从数据样本中“学习”或“体验”。若任务规则是未知的,我们就能应用统计数据和归纳推理让机器自己学习。
1704605211
1704605212
在技术领域之外,人工智能仍处于试验阶段。但人工智能研究的前端正在稳步前进,这反过来扩大了计算机能完成的潜在任务集。深度思考公司(Deep Mind)的阿尔法围棋(AlphaGo)在2016年成功打败了世界上最好的职业围棋选手李世石(Lee Sedol),这可能是最广为人知的例子了。随着李世石的失败,人类在经典棋盘游戏中失去了最后一点竞争优势。二十多年前人类在国际象棋领域被超越。众所周知,在1996年的一场六局的比赛中,国际象棋大师加里·卡斯帕罗夫(Garry Kasparov)在对阵IBM的“深蓝”(Deep Blue)时胜了三局,但在一年后的历史性重赛中输掉了比赛。
1704605213
1704605214
与国际象棋相比,围棋的复杂性是惊人的。围棋比赛在一个19乘以19的正方形棋盘上展开,国际象棋的棋盘则是一个8乘以8的正方形。1950年,数学家克劳德·香农(Claude Shannon)在他的开创性论文中演示了如何编写程序让机器下国际象棋。国际象棋中可能的最大移动步数的最小估值大于可观察宇宙中的原子数。围棋中的移动步数的估值则是这一数值的两倍。 2 事实上,就算宇宙中的每一个原子自己都独立成为一个宇宙,且里面包含的原子数和我们宇宙中的原子数相同,原子的数量仍比围棋中可能的合法移动步数要少。这种比赛的无限复杂性意味着即使是最厉害的棋手也无法将其分解为有意义的规则。取而代之的是,职业棋手通过识别“一些棋子包围空间”这一模式来下棋。 3 如上所述,2004年,弗兰克·利维和理查德·默南出版《新劳动分工》时,人类在模式识别方面仍具有比较优势。 4 当时在识别模式上计算机还无法挑战人脑,但现在它们做到了。
1704605215
1704605216
比阿尔法围棋获胜这一事实更重要的是,它是如何做到的。“深蓝”是基于规则的计算时代的产物,它的成功取决于程序员给棋盘上的各种位置编写清晰的if-then-do规则的能力。但阿尔法围棋的评估引擎并没有被明确编程,因此,它并不遵循程序员预先指定的规则,而是能够模仿人类潜藏的知识,从而避开了波兰尼悖论。“深蓝”基于自上而下的编程,阿尔法围棋则是自下而上的机器学习的产物,它使用巨大的数据集,通过一系列实验来推算自己的规则。阿尔法围棋的学习步骤是首先观看之前的专业围棋比赛,然后以自己为对手,下数百万场围棋,稳步改善自己的表现。阿尔法围棋的训练数据集(包括16万名专业棋手在棋盘上的300万个位置)远超任何一位职业棋手一生积累的经验。这一事件标志着埃里克·布林约尔松(Erik Brynjolfsson)和安德鲁·麦卡菲(Andrew McAfee)提出的“棋盘的后半部分”。 5 《科学美国人》惊叹道,“一个时代结束了,新时代开始了。阿尔法围棋背后的方法和它最近的胜利极大影响了机器智能的未来”。 6
1704605217
1704605218
“深蓝”也许能在国际象棋领域打败卡斯帕罗夫。但出乎意料的是,卡斯帕罗夫能轻易地在其他任何任务中获胜。“深蓝”唯一能做的事就是每秒评估棋盘上的两亿个位置。它是为一个特定目的而设计的。但另一边,依赖于神经网络的阿尔法围棋几乎能完成无穷无尽的任务。通过使用神经网络,深度思考公司已经在大约50个雅达利(Atari)电子游戏中(包括《电子弹珠台》《太空侵略者》和《吃豆人》)有了超人的表现。 7 当然,程序员提供的指令能让机器取得最大得分,但算法能通过数千次尝试,独自学习最佳游戏策略。毫不意外的是,阿尔法围棋(或其通用版本AlphaZero)在国际象棋比赛中的表现也胜过预编程的计算机。AlphaZero只需学习四个小时就能在比赛中打败最好的计算机。
1704605219
1704605220
和阿尔法围棋的胜利一样,最近的许多进展都得益于呈指数级增长的数据集(它们被统称为大数据)。数字化以后,事物的存储和传输几乎免费了。几乎所有的东西都可以数字化,每天通过网络浏览器、传感器和其他联网设备产生的数据将近数十亿吉字节(gigabyte,缩写为GB,1GB等于2^30字节)。电子书、音乐、图片、地图、文本、传感器读数等构成了巨大的数据库,为我们的时代提供了原始材料。随着世界上通过数字连接的人口比例越来越高,越来越多人有机会大量接触这个世界积累的知识了。这也意味着越来越多的人能够参与到这个知识库中来,从而形成一种良性循环。数十亿人在线上互动,留下数字足迹,算法能够由此了解他们的经历。思科(Cisco)预计全世界的互联网流量在未来五年会增长近三倍,到2021年会达到3.3泽字节(zettabyte,缩写为ZB,1ZB等于2^70字节)。 8 为了更清楚地理解这一数字,我们列举下面的例子来进行对比:加利福尼亚大学伯克利分校的研究人员估计,全世界所有书籍包含的信息大约是480太字节(terabyte,缩写为TB,1TB等于2^40字节);人类曾说过的所有字词的文本记录约为5艾字节(exabyte,缩写为EB,1EB等于2^60字节)。 9
1704605221
1704605222
数据完全可以被视作新的石油。随着大数据变得更大,算法也会变得更好。若想用更多实例说明这一点,可以列举数据在翻译、语音识别、图像分类和许多其他任务中不断改善的表现。例如,人类翻译的数字化文本语料库越来越大,意味着在再现人类翻译方面,我们能够更好地评价算法翻译器的精确性。联合国的每一份报告都会由译员翻译成6种语言,这为机器翻译提供了更多学习的实例。 10 数据供应越多,计算机表现越好。
1704605223
1704605224
谷歌翻译利用了大量算法,但是如果没有摩尔定律支撑计算机硬件取得巨大进步,谷歌翻译会远远不如现在这么流行。包括处理速度、微芯片密度、存储能力等在内的计算构件在数十年中一直保持着指数级增长。比如,人工神经网络(模拟大脑神经元连接方式的计算单元层)的想法大概在20世纪80年代就出现了,但由于当时计算资源的诸多限制,神经网络表现很糟糕。因此直到最近,机器翻译仍然依赖于那种从数百万人工翻译中逐字分析短语的算法。然而,基于短语的机器翻译存在着严重的缺点。尤其是这种算法关注的面很狭窄,失去了更大的语境。解决这一问题的方法之一是所谓的深度学习,它使用更多层次的人工神经网络。这些进展使得机器翻译能更好地掌握复杂的句子结构。在过去的训练和翻译推理中,神经机器翻译(Neural Machine Translation)的计算成本都很高。但归功于符合摩尔定律的进步和更大的数据集的可用性,神经机器翻译如今已变得可行了。
1704605225
1704605226
机器翻译中的深度学习并非没有缺点,它面临的主要挑战之一就是生僻字词的翻译。比如,如果你在一个基于神经机器翻译的系统中用日文输入“一生仅有一次的邂逅”(“一期一会”),得到的结果可能是“阿甘正传”。一开始你可能会奇怪,但这句话碰巧是这部电影的日版副标题。同时,这个短语还很少见,没有在其他语境下出现过。然而,机器学习研究者把单词分成了更小的子单元,这种创新方法至少部分地避免了这个问题。2016年,谷歌的一个研究团队在《自然》(Nature)杂志上发表文章证明,与基于短语的旧系统相比,“单词单元”和神经网络一起使用,使错误率降低了60%。 11 虽然谷歌的神经机器翻译系统仍落后于人类的表现,但它正在迎头赶上。
1704605227
1704605228
类似于蒸汽、电力和计算机,人工智能也是一项有着广泛用途的通用技术。正如经济学家伊恩·科伯恩(Iain Cockburn)、丽贝卡·亨德森(Rebecca Henderson)和斯科特·斯特恩(Scott Stern)所指出的那样,与人工智能相关的出版物发生了巨大的转变,从计算机科学杂志转为以应用为导向。他们估计在2015年,与人工智能相关的所有出版物中,近三分之二会不属于计算机科学领域。 12 他们的发现与普遍的观察结果一致,人工智能被应用在一系列不同领域的任务中。在机器翻译中表现良好的技术同时也被用于完成诸如图像识别这类视觉任务。从一幅图像中的单个像素开始,这些算法的运算特征(比如几何图案)日趋复杂。
1704605229
1704605230
近年来,图像识别技术的发展是指数级的。图像标签识别的错误率从2010年的30%下降到了2017年的2%。 13 这项技术虽然在许多方面仍处于试验阶段,但已取得了一些令人振奋的进展。比如,德国用自动人脸识别技术尝试识别经过柏林南十字车站的人,实验取得了成功,这对安保人员的工作起到了辅助作用。德国内政部长托马斯·德迈齐埃(Thomas de Maiziere)报告说,在实验中,70%的时间里的人物识别都是正确的。在图像质量很差的情况下,算法识别的标记错误率不到1%。 14 用于识别人脸的同一类型的人工智能已被证实同样擅长诊断疾病。《自然医学》(Nature Medicine)杂志上发表的一项新研究表明,人工智能已经能够通过病理学图像识别不同类型的肺癌,而且准确率高达97%。 15 另一项发表在2017年的《自然》杂志上的新研究通过神经网络和129,450张临床图像组成的数据集,将人工智能的表现和21位获得认证的皮肤科医生进行比较,发现人工智能的表现与人类持平:“在两项测试任务中,这种算法的性能和所有受测试专家的表现不分上下。这说明人工智能对皮肤癌症进行分类的能力比得上皮肤科医生的水平。如果配备了深度神经网络,移动设备将有望把皮肤科医生的能力范围扩大到诊所之外。据估计,到2021年智能手机用户将达到63亿,因此人工智能有望为人们提供普遍的低成本诊断机会。” 16
1704605231
1704605232
机器不仅成了更好的译员和诊断医师,它们也正在成为更好的倾听者。语音识别技术正以惊人的速度发展。2016年微软宣布取得了一项里程碑式的成就,他们的转录对话技术达到了人类的水平。2017年8月,微软人工智能团队发表的一份研究报告披露了他们取得的进一步进展,把错误率从6%降低到了5%。 17 正如图像识别技术有望在诊断任务中取代医生,语音识别技术和用户交互领域的发展则有望取代完成某些交互任务的工作者。众所周知,苹果的Siri、谷歌的语音助手和亚马逊的Alexa都依赖自然的用户界面来识别口语、理解含义和据此做出回复。一家名为Clinc的公司使用语音识别技术和自然语言处理技术,目前正在开发一种新的人工智能语音助手,它将被用在像麦当劳或塔可钟这样的快餐店免下车窗口上。 18 2018年,谷歌宣布正在开发用于取代客服中心工作人员的人工智能技术。客户拨打的电话将由虚拟客服接听。如果客户的要求涉及一些算法目前还不能处理的事情,电话就会被改派到人工客服那里。然后,另一种算法将通过分析这些对话来识别数据中的模式,这反过来又有助于提高虚拟客服的能力。 19 技术的不断发展可能给劳动力市场带来巨大的影响。虽然许多公司数十年来都在将工作移到海外,但仍有约220万美国人在遍布全国的6800个客服中心工作,还有几十万人在更小的地方从事类似的工作。 20
1704605233
1704605234
最大的跳跃式发展之一发生在自动驾驶领域。1958年,为了应对苏联发射第一颗人造地球卫星“斯普特尼克1号”,美国总统德怀特·艾森豪威尔(Dwight Eisenhower)创立了国防部高级研究计划署(DARPA)。2004年,计划署首次举办无人驾驶汽车挑战赛。比赛目标是在没有人类的帮助下,让汽车在10小时内驾驶228.5km,穿越莫哈维沙漠。这些汽车最远行驶了11.4km,有几辆甚至都没有开出起跑线。因此也就无人赢得100万美元的大奖。但在2016年,世界上第一批自动驾驶出租车已经开始在新加坡载客了。
1704605235
1704605236
自动驾驶领域的最新进展要归功于大数据和巧妙的算法。如今,在一辆汽车内存储完整的路网图像已经成为可能,这种情况简化了导航问题。季节变化带来了下雪这样的挑战,这一直都是算法导航的关键技术瓶颈。但如今通过存储上次下雪的记录,人工智能已经能够处理这个问题。 21 人工智能研究者们已经表明,基于算法的自动驾驶系统现在已经能够识别环境中的道路施工等重大变化了。 22 我在牛津大学的工程学同事博诺洛·马蒂贝拉(Bonolo Mathibela)、保罗·纽曼(Paul Newman)以及英格玛·波斯纳(Ingmar Posner)在一项重要的研究中总结道:“因此,车辆如果在路上遭遇行人或其他可能导致车辆无法保持稳定的情境,能据此做好准备,从而像人类一样获得了情境意识的动态感知。” 23
1704605237
1704605238
虽然自动驾驶汽车仍处在发展初期,但它已被广泛用于多种情境。一些农用车辆、叉车和货物装卸车辆已经实现自动驾驶。近年来,医院已经开始使用自动机器人运送食物、处方和样本。 24 2017年,英国-澳大利亚的金属和矿业巨头力拓集团宣称,2019年之前将把皮尔巴拉矿区的自动运输卡车车队规模扩大50%,操作实现完全自动化。 25 但截至目前,绝大部分自动驾驶车辆的使用都限于仓库、医院、工厂和矿山等相对结构化的环境。当计算机程序能对车辆可能遭遇的物体和场景范围进行更好的预测,自动化就相对简单了。通过显式的if-then-do的规则,程序能够在其他物体接近时告诉车辆停下或减速。然而,在非结构的环境(比如大城市的街道)中,可能的情况会非常多,以至于这种方法需要的类似规则接近于无穷。
1704605239
1704605240
最近,人工智能与廉价且强大的数字传感器相结合,优化了全自动驾驶车辆在非结构化环境中的应用前景。通过在车辆上配备大量传感器,如今的汽车公司收集了数百万英里的人类驾驶数据供算法学习。阿杰伊·阿格拉沃尔(Ajay Agrawal)、乔舒亚·甘斯(Joshua Gans)和阿维·戈德法布(Avi Goldfarb)写道:“通过将车外的传感器感应到的环境数据与车内的人做出的驾驶决策(转向、刹车、加速)关联起来,人工智能学习了人类对每秒从环境中接收的数据做出的反应并学会了做出预测。” 26 然而,所有人工智能模型都存在着一个明显的限制因素,也就是当它们的训练数据中未曾出现的新情况出现时,它们就很难做出预测。在城市交通中,车辆会不断遭遇新情况。解决问题的方法之一是降低环境的复杂性。在得克萨斯州的弗里斯科,Drive.ai公司使用自动驾驶的小型载客车载人,但它们只在特定的办公区和零售区域使用。工程师并没有尝试模仿人类司机,而是试图将事情简化。上车下车都被限定在了指定的站台:“乘客通过一款应用程序呼叫客车,然后走到最近的站台,等车辆出现,然后上车。” 27
1704605241
1704605242
众所周知,通往自动驾驶的道路是一条影响深远的进步之路,但也是一条挫折之路。2018年在亚利桑那州的坦佩,一名骑车过街的女性不幸被优步(Uber)的自动驾驶汽车撞死了。这一事件引起了人们对安全的担忧,更重要的是它引发了人们对自动驾驶的未来的担忧。然而,类似的悲剧性挫折在早期的交通技术中同样普遍。正如第四章已提到的,1830年第一条公共铁路运行时,由于刹车反应很慢,一名议员遭受了致命伤害。几乎每家英国媒体都报道了这个事故,但它并没有阻碍人们使用铁路技术。在拖拉机加快推广前的1931年,《纽约时报》报道过在新泽西州萨默维尔,一辆拖拉机轧死了一名4岁男童。在另一次事故中,一辆拖拉机爆炸导致多人死亡。 28 同样值得注意的是,就在工程师不断推进自动驾驶技术发展的同时,人类司机造成的事故每一分钟都在发生。美国国家公路交通安全管理局(NHTSA)委托开展的一项车祸调查发现,人为错误占车祸原因的92.6%。 29 死亡人数很多:仅在2013年,全球就有125万人死于车祸,美国的数字为3.2万。 30 因此,自动驾驶汽车并不是要达到完美才可以正当使用。人类司机当然也不是。
1704605243
1704605244
仍有些情况是自动驾驶车辆无法处理的。尤其是在拥挤的城市,行人和骑自行车的人带来了额外的复杂因素。在新加坡,自动驾驶出租车上有在紧急情况下接手操控的安全司机,可以将事故的可能性降至最小。自动驾驶汽车虽然尚处于试验阶段,但已经能够在城市中成功使用。在东京,一辆配备安全司机的自动驾驶出租车已经开始搭载付费乘客了,“这提高了人们对2020年夏季奥运会的期待,届时自动驾驶汽车可能搭载运动员和游客在运动场和城市中心之间穿行。” 31 底层人工智能系统需要从车辆传感器收集数百万英里的真实数据,所以这些事件很重要。但是数据量并不是全部。在州际高速公路上开车、在一个安静的中西部小镇上开车和在曼哈顿开车,这三者大不相同。这对算法来说是如此,对人类司机来说也是如此。因此,允许在城市交通中使用算法是迈向无人驾驶交通时代的重要一步。
1704605245
1704605246
然而,由于城市之外的复杂因素更少,那里的进展可能会更快。2015年5月,戴姆勒-奔驰公司的第一辆自动驾驶卡车上路了。在得到内华达州的允许后,自动驾驶系统只能够在高速公路上运输货物(为了使事情暂时变得简单)。2016年10月,在科罗拉多州,一辆自动驾驶的半挂车成功地把5万罐百威啤酒从柯林斯堡运送到了科罗拉多斯普林斯。卡车在州际公路上自动行驶了161km,但到城市边界时,人类司机接手了。
1704605247
1704605248
这些成就得到的回应褒贬不一。如今美国有190万名重型卡车司机和牵引式挂车司机。虽然在未来几年不太可能,但人们普遍担心自动驾驶卡车会带来“海啸般的裁员”。 32 对于这些担忧,我们必须记住一点,那就是技术发展可能遭遇的壁垒不仅仅是技术方面的。正如我们在前面的章节已了解到的,如果工人们面临糟糕的替代选择,就会抵抗取代技术。我们又要回到这个问题上来。
1704605249
1704605250
当然,并不是说自动驾驶汽车一开始崛起,所有执行运输和派送任务的人都立马会面临风险。正如罗伯特·戈登等对人工智能持怀疑态度的人指出的那样,“即使亚马逊的汽车能开到我家门口,包裹又怎么从车里下来,来到我的门厅呢?我不在家的时候谁签收包裹呢?” 33 与此同时,我们能够通过精巧的任务重设,克服那些在过去看起来更加复杂的工程问题。正如汉斯·莫拉维克所指出的,计算机很难完成对人类来说非常简单的许多任务,而人类也很难完成对计算机而言十分简单的许多任务。然而,尽管这种情况仍然成立,但工程师也已经能简化任务,采取措施一步步解决莫拉维克悖论(见第九章)。
1704605251
1704605252
事实上,一个普遍的误解认为,如果一个任务需要实现自动化,机器必须精确复制它要取代的工人的操作步骤。自动化发生的主要方式就是简化。就算最先进的机器人技术也无法复制中世纪工匠们的操作步骤。只是因为此前在工厂情境中的非结构化任务被细分、简化,生产自动化才得以实现。工厂里的流水线把手工作坊中的非常规任务变成了能够用自动化机器人完成的重复性任务。与之类似,我们并没有发明能够砍树、提水、把木头和煤炭从室外搬到炉子旁,并执行用手洗衣所需的动作的多用途机器人来实现洗衣的自动化。我们也没有发明把灯夫的工作自动化的能够爬上灯柱的机器人。
1704605253
1704605254
简化任务的一个当代实例就是预制(prefabrication): 34 “现场建造任务通常需要高度的适应性,从而适应那些布局经常并不规则的、会随天气情况而变化的施工环境。预制就是在把建筑组件运送到施工现场之前就在工厂完成部分组装,这在很大程度上消除了对适应性的要求。它通过在受控条件下使用机器人来完成许多建造任务,消除了任务的复杂变化性。这种方式逐渐普及开来,特别是在日本。” 35 这种情况不仅出现在了建筑业中。零售业中巧妙的任务重设也带来了很有前景的效果。比如亚马逊采用了Kiva系统,在地板上放置条形码标签告知机器人物品摆放的精确位置,解决了仓储导航的问题。通过巧妙的任务重设,工程师们已经打破了“机器人能做什么”的规则限定。
1704605255
1704605256
20世纪90年代末,电脑为零售业注入了动力。但随着企业发展很快遇到瓶颈,生产率增长无法持续下去。商品仍然需要从工厂运到仓库,然后到零售店,最后到达终端消费者手中。卡车运输“根本就不是一项高效的活动,因为送货司机需要穿梭于拥挤又坑坑洼洼的街道,寻找停车位,按门铃,然后等回复”。 36 为了解决这个问题,亚马逊正在试验使用无人机(能避开拥挤的街道)配送。我们在回顾戈登提出的“包裹怎样才能从亚马逊的货车来到我的门厅”这一问题时发现,许多包裹不通过汽车派送的可能性越来越大。比如在伦敦,一家叫Skyports的公司计划将屋顶的空间改造成供无人机起降的垂直升降场。2018年3月,亚马逊获得了一项根据人类手势进行派送的无人机专利。这项技术应该有助于解决“飞行状态下的机器人如何与人类旁观者和等在门阶上的顾客进行互动的问题。据该专利描述,无人机可以根据人的姿势(大拇指向上的欢迎姿态、喊叫或疯狂挥手等)来调整自己的行为。它还宣称,无人机能放下运输的包裹,调整飞行路径以避免撞击,向人类提问题以及放弃派送”。 37
[
上一页 ]
[ :1.704605207e+09 ]
[
下一页 ]