1700043992
机器人学家对这种只在1%的时间内才发生的突发性小概率事件赋予了专门的名称——“极端事件(Corner Cases)”。极端事件并不常见,也难以预测,却可能导致灾难性后果。机器人的人工“本能”在处理极端事件时的效果最终决定了它的可靠性与价值。如果一个机器人的软件无法处理它所遇到的每一个极端事件,那么希望人们不会放任它独自行动,否则最坏的情况就是机器人无法完成交代的任务并造成了严重的破坏。
1700043993
1700043994
驾驶也许是最为重复刻板的活动,但同时也充满了数不尽的、潜在的致命性极端事件。管理无人驾驶的软件必须能够本能性对突发情况做出反应,例如跳上汽车引擎盖的鹿,或者向汽车挡风玻璃上喷漆的愤怒乞丐,这些都有可能发生——还要祈祷乘客会为挡风玻璃上的污渍付清洁费——所以,尽管投入了几十年的努力,自动化工程师和机器人专家还是无法编写出一个有效的软件,处理无人驾驶在道路上可能遇到的无数种突发状况。
1700043995
1700043996
机器人技术中一条基本的规则就是,环境越是简单、越是容易预测(极端事件越少),构建一个使机器人在这种环境下执行任务的软件就越简单。机器人能在工厂里广泛普及是因为大多数工厂都是一个封闭的世界、一个高度结构化的环境,在那里极端事件是能够预测的,而且会被工业工程师小心地排除。在封闭的环境中,机器人的工作职能会围绕特定任务进行设计。工厂里的机器人知道将会发生什么。指导它们运行的软件会引导机器人进行一系列一成不变的活动,例如冲压金属部件、固定螺栓,或者将箱子从一侧拉到另一侧。
1700043997
1700043998
虽然在工厂里可以设计一个整齐划一的封闭式环境,然而在实际环境中,街道和高速公路上是复杂混乱且难以预测的。汽车方向盘后的每个司机不仅要处理新的突发情况,还必须应对其他相关挑战,这些挑战是软件程序难以处理的,由模糊的或者高度情境化的行为规则调控的信息交互问题。人工智能软件尤其会在对安全驾驶有重要影响的两类活动中出现问题,即复杂的非语言信息沟通,和在多种情境中对同一物品进行持续正确识别。
1700043999
1700044000
驾驶行为要求司机和行人之间进行复杂的“社交”活动。当人类司机位于方向盘后面时,通常会参与到一场非语言的“社交芭蕾舞剧”中,并用点头、挥手、眼神交流来传达他们的意图。挥手和微笑对于人类而言可能是简单的,但是想要编写一套软件来识别人类的面部表情、身体语言并做出恰当的回应,则异常困难。
1700044001
1700044002
无人驾驶汽车,这一移动版机器人不仅在识别复杂的非言语交流上存在困难,当需要应对突发事件时,它们的计算机智能也会捉襟见肘。这些问题均是由知觉缺陷导致的,即它们不具备对所见事物进行感知区分并合理应对的能力。理想情况下,计算机科学家会通过编写一套程序来解决这个问题,为汽车提供一致性、准确的人工意识和情境理解能力。然而直到目前为止,这个问题还没有被解决,这样的软件还没有做出来。自从人工智能领域开辟半个多世纪以来,计算机科学家和机器学家为了实现“知觉”这一神秘技艺的自动化已经尝试了各种方法,但均未能取得突破性进展。
1700044003
1700044004
生物有机体的知觉系统包含了一系列广泛的能力。知觉中的一个方面就包含认知识别功能,人或动物因此具有“读取”复杂情境的能力,并知道如何正确地反应。知觉的另一个功能就是加工处理视觉信息。生命体具有高度发达的视觉系统,可以良好地识别一个物体,甚至是从不同的角度、在不同的光线条件以及不熟悉的情境中都可以准确识别同一个物体。
1700044005
1700044006
视觉感知需要对视觉信息进行正确识别并进行归类,人类在进行这样的过程时,纯粹依靠本能,而且几乎能够做到完美无误。然而,我们这种感知所见事物的能力似乎拒绝被自动化。几十年来,机器视觉领域的研究者一直在努力研发能够快速而准确地“理解”环境中视觉信息的软件,但均以失败告终。
1700044007
1700044008
在机器人发展史的大部分进程里,它们都难以处理视觉信息。工业机器人应对这一缺点的方式就是在全封闭、黑暗无光的工厂环境中纯机械化地辛勤工作。而对于那些工作中涉及某些视觉活动的机器人,它们的工作方式则被设定为绝不去分类或检查它们不熟悉的事物。
1700044009
1700044010
阻碍机器视觉软件发展的另一因素就是计算能力的不足。由于处理图像是一项数据密集型活动,所以第一代机器视觉系统只能采取一种结构化路径的方式来实现这一流程,即用一系列“规则”来解析视觉信息。这些早期机器视觉系统的工作原理是想尝试将识别的物体与机器人内部储存的已知物体小型样例库做匹配,但显然这是一个缓慢、不准确也不灵活的过程。
1700044011
1700044012
早期机器视觉软件的最大缺陷之一,就是它们在应对新鲜事物或情境时表现不佳。即便是很熟悉的物体,只要在略微不同的场景中出现,任何借助这类软件引导的机器人(或汽车)都无法进行准确识别。鉴于准确识别邻近物体这一能力对于安全驾驶至关重要,机器视觉软件的差劲表现数十年来一直阻碍着无人驾驶汽车的发展。然而,最近在人工智能领域的一项突破进展可能会彻底改变这一切。
1700044013
1700044014
在人工智能研究领域原地踏步多年之后,一种被称为“深度学习(Deep Learning)”的新型软件于2012年诞生了,它可以对随机的数千个数码图像信息进行准确分类,并达到人类水平的精准度。虽然对随机物体的图像进行准确分类的能力听起来无足轻重,但这一能力的确是人工知觉(Artificial Perception)的基础。一旦某个物体可以被精准识别,它的信息会被“转化”给其他类型的人工智能软件,而那些软件就可以发挥其传统优势:利用统计分析或某种逻辑、规则推导出最佳反应。
1700044015
1700044016
深度学习软件对于无人驾驶如此有价值,就是因为它可以在开阔公路这种非结构化的环境中充分发挥作用。深度学习隶属于“机器学习(Machine Learning)”这一类人工智能软件。这类软件的突破创新并非由人类程序员来设计,机器学习软件并不会去建立一个现实世界的模型,再用正常的逻辑和规则来处理其中的问题,相反机器是通过大量的训练数据后被“喂养”出来的。例如,为了开发无人驾驶所用的深度学习软件,程序员每天会用几千兆字节(Gigabyte,即GB)的原始视觉素材来“喂养”这个软件,而这些视觉素材都是通过车载摄像头在真实道路环境下的行驶中拍摄收集的。
1700044017
1700044018
深度学习软件通过观察世界来“学习”,这一点赋予了它另一巨大优势——不依赖规则(not rule-bound)。人类的婴儿学会依照物体的突出可识别性特征来识别物体,同理,深度学习软件在对物体分类时也是依据物体的视觉特征。使用规则依赖的传统途径编制的软件,遇到坐在自行车上的猫的图片时,就会陷入困惑。相反,深度学习软件会关注猫身上可供识别的视觉特征——尖耳朵和尾巴,然后不管这只猫是出现在一个多么奇怪的情境中,软件都会迅速而准确地推测出它只是一只猫。
1700044019
1700044020
深度学习软件已经彻底改进了对人工知觉的研究,并极其成功地应用到语言识别领域,以及其他需要软件来处理古怪异常信息的活动中。过去的几年里,为了寻求深度学习的专业技术支持,很多汽车公司都在硅谷设立了分部。谷歌和百度这些软件巨头本身已经具备了管理巨量信息和构建智能软件的能力,再加上深度学习领域的专业优势,足以支撑它们与曾经不可一世的汽车巨头在无人驾驶领域展开角逐。
1700044021
1700044022
深度学习对于人工智能领域的影响极其深远,甚至在我们写作本书时,其影响还在逐步拓展,而且未来几年可能会持续扩大。深度学习所引领的技术领域并不只是汽车一隅。我们预计,深度学习将会对移动类机器人的总体发展轨迹产生变革性影响。当机器人获得了通过视觉理解周遭环境的能力时,人工生命形态的发展可能会开始延续5亿多年前有机体生命发展的路径——化石显示大约在寒武纪以前,所有形态的有机体生命都是近乎眼盲的。当5亿多年前寒武纪开启时,那些近乎眼盲的有机体突然神秘地演化出了复杂的新型视觉系统,要知道先前它们的“眼睛”只是些光感性的原始细胞集。一旦它们具备了看的能力,这些简单的有机体随之演化出了复杂的身体形态,以便实现快速的反应和移动。反过来,新的身体机能又会需要发展一个更大号的大脑来监管这些新生肢体的协调。当装备上视觉系统、快速响应的身体以及更大的大脑时,曾经不起眼的细胞集演化出了种类繁杂的复杂生物,它们从最初生命的泥沼中爬出,并努力在陆地上寻求属于自己的一块领地。
1700044023
1700044024
关于寒武纪生命大爆发——发生在寒武纪时期的生命大量快速演化,有一个有趣假设,即“光开关理论(Light Switch Theory)”。这个理论是由安德鲁·帕克(Andrew Parker)提出的,该理论认为正是眼睛的进化,引发了生命体之间的进化竞赛,使得那些具备最佳视觉的生物才最有可能生存下来。也许“光开关理论”理论对于机器人也是适用的。
1700044025
1700044026
曾经“眼盲”的机器获得了知觉的能力,它们也会从原始的禁锢中爬出,摆脱现今我们为其设计的结构化的、黑暗的工厂环境。健全的机器视觉将使得机器人可以充分利用其新添加的身体部件——轮子、四肢或踏板,而那些部件能为它们提供更高水平的灵敏度。想要控制复杂的机械新“四肢”,它们的机器大脑也会随之扩张。当我们目睹机器人掌握了新的技能并找到可以发挥功效的新应用场景时,我们也终将见证机器人形态和功能的“寒武纪大爆发”。
1700044027
1700044029
迎接无人驾驶
1700044030
1700044031
一群热带鱼的行动过程十分值得观赏。它们组成紧凑而均匀的队形,扭动着明亮鲜艳的身体在水中游弋。这几十条不同的鱼可以一瞬间同时转向掉头,动作一致犹如一个整体。如果有个障碍物突然出现在鱼群的行进路线上,鱼群会分开绕过,然后迅速重新建立起它们先前的队形。鱼群彼此之间从不相撞,也不会触碰到浪涛裹卷而来堵在路上的异物——枝条、石子或珊瑚礁。
1700044032
1700044033
在理想的将来,我们的街道和高速公路上会充满成群的、紧密分布的无人驾驶汽车。与鱼群一样,无人驾驶汽车的车流会展现出惊人的防冲撞能力,在充满行人的城市街道上机智而快速地穿梭,在漫长而空旷的高速公路上以经济油耗的形式灵活停靠。有些车会携带一两名乘客,还有些车是完全没有乘客的,那是因为它们要去送外卖或者去幼儿园接小朋友。
1700044034
1700044035
那么,从今天人类掌控的这种糟糕交通状况,到实现理想的未来——各种形状、大小的无人驾驶汽车井然有序而安全地填充在道路上,我们应该如何着手呢?在欧内斯特·海明威(Ernest Hemingway)1926年的小说《太阳照常升起》(The Sun Also Rises)中,主人公比尔问麦克:“你是怎么破产的?”麦克回答:“两种方式,慢慢地,且突然地。”
1700044036
1700044037
实际上,技术的发展是迅速的。目前为止,读过本书的绝大多数人还是熟悉摩尔定律的。摩尔定律指出当计算机芯片的表现以幂次方提升增长时,芯片的价格和尺寸也会以幂次方的速度大幅降低。正如摩尔定律反映的,构成无人驾驶汽车的传感器、海量数据以及处理和计算所有信息的处理芯片,这些技术已经变得相当成熟可靠、物美价廉了。无人驾驶汽车的具体配置可能千差万别,但大多数无人驾驶汽车都会装载几个数码镜头、一个雷达传感器以及一个激光雷达装置来“看看”它们现在在哪里。数字化的汽车在配置全球定位系统(GPS)的同时还会匹配另一个称为惯性测量单元(inertial measurement unit,IMU)的定位装置,用以弥补GPS的误差。还会有一个车载电脑负责将各个传感器和GPS的信息汇总,将数据传递到一个包含各个交叉路口和红绿灯信息的高精度数字地图上,然后将所有这些信息生成一个汽车外世界的数字模型,被称为占据栅格(Occupancy Grid)。
1700044038
1700044039
无人驾驶技术几近成熟。埃隆·马斯克(Elon Musk)是特斯拉汽车公司的CEO,十分推崇全自动化的汽车,他对当前形式的总结是:“问题比人们想象的要简单……但也不是一个人苦干三个月就能解决的,它更有可能是需要数千人共同奋斗两年才能实现。”虽然这种技术几近准备就绪,但是这一独特技术所依存的社会环境可能还未准备妥当。
1700044040
1700044041
诸多社会因素制约了无人驾驶的推广应用。软件开发人员不得不面对的一个问题就是用户本身。当新的软件引入到一个组织中时,影响软件普及的最大阻碍通常不是软件自身的工作表现,而是人们对之前产品的依赖。由于这些用户的组织文化和工作流程都建立在之前的软件产品上,而改变人们的工作习惯就会引发阻抗。一旦工作流程改变,有些人就会失去地盘,有些人会被迫重新思考如何做事,诸如此类。人员问题通常是隐藏在海平面下的冰山,它会阻挠一个组织成功吸收新技术,尽管这一技术可以节省组织的时间、金钱,并提高生产力。
[
上一页 ]
[ :1.700043992e+09 ]
[
下一页 ]