1700043980
当机器人学家还在研究移动化智能机器人的道路上步履维艰时,建造一辆踏实可靠的无人驾驶汽车从技术上而言已经触手可及,这同样也是工程学上的一项壮举。因为对于程序员为人工智能写代码操作运动过程来说,汽车相比其他形式的移动化机器人有一个巨大的优势——滚动要比行走或爬行简单得多。
1700043981
1700043982
如果人工机器人具备多个肢体部件,那么管理其动作快速运行的软件从体量和复杂性上都要比智能汽车大得多,因为多肢体部件可以演化出数量近乎无限大的不同动作模式和相对位置。相反,一辆汽车的四个轮子、刹车以及方向盘组合出的运动模式几乎全部是可预测的。引导无人驾驶运动的软件所管控的动作组合数量必然相当少,例如多半只是车轮的左右转动,或者监控汽车是在减速还是加速。
1700043983
1700043984
驾驶行为可以自动化的第二个原因在于,开车是一个相对刻板重复的反应式活动,无论智力高低都能拿到驾照,因此无人驾驶的智能只需满足以下条件就够了:对清晰可见的路面危险——比如不断靠近的路面坑洼或者缓慢行走的成群结队小学生——做到即时反应,沿着清晰明了的道路或高速行驶,并且遵守相对简单的交通规则。
1700043985
1700043986
说到这儿,怀疑论者就会指出这背后一定另有故事。的确,如果只是简单地编辑程序让四个轮子的机器人遵守道路交通规则,那么无人驾驶在几十年前就早已普及了。汽车为什么直到现在才有可能变得智能自动化呢?源于两个原因:
1700043987
1700043988
第一是现实因素,也就是它的门槛很高。汽车毕竟是行驶在公共街道上的重达两吨的“铁盒子”。如果引导无人驾驶的软件出现了问题,后果将不堪设想。“人命关天”,这也就解释了为什么今天的第一批自动驾驶车辆会先在人烟稀少的地方使用,因为车辆如果在这种地方出问题、偏离既定的路线,所造成的人员伤亡是最小的。例如,在偏僻的澳大利亚北部矿石公司使用巨大的自动化驾驶卡车来运载矿石;农民使用自动驾驶的拖拉机、联合收割机在广袤而无人的农地里耕作;在配送中心和工厂里,专门的自动化车辆会将货物从房间的一侧运到另一侧;在度假村或机场,名为纳维亚的无人驾驶穿梭车会以既定每小时15英里的速度沿着固定路线往返运送乘客……
1700043989
1700043990
制约无人驾驶发展的第二个难点及关键点就是纯粹的技术问题。虽然在99%的时间里,驾驶过程都是思维僵化而且可预测的,但是仍有1%的时间里会产生突发事件。生物有机体会依赖所谓的“本能(Simple)”来应对生活中突发的未知事件。是“本能”,使人类可以在交通的高峰时段自由驾驶,也正是“本能”,蕴含了人类智能中尤为难以复制的大量能力。
1700043991
1700043992
机器人学家对这种只在1%的时间内才发生的突发性小概率事件赋予了专门的名称——“极端事件(Corner Cases)”。极端事件并不常见,也难以预测,却可能导致灾难性后果。机器人的人工“本能”在处理极端事件时的效果最终决定了它的可靠性与价值。如果一个机器人的软件无法处理它所遇到的每一个极端事件,那么希望人们不会放任它独自行动,否则最坏的情况就是机器人无法完成交代的任务并造成了严重的破坏。
1700043993
1700043994
驾驶也许是最为重复刻板的活动,但同时也充满了数不尽的、潜在的致命性极端事件。管理无人驾驶的软件必须能够本能性对突发情况做出反应,例如跳上汽车引擎盖的鹿,或者向汽车挡风玻璃上喷漆的愤怒乞丐,这些都有可能发生——还要祈祷乘客会为挡风玻璃上的污渍付清洁费——所以,尽管投入了几十年的努力,自动化工程师和机器人专家还是无法编写出一个有效的软件,处理无人驾驶在道路上可能遇到的无数种突发状况。
1700043995
1700043996
机器人技术中一条基本的规则就是,环境越是简单、越是容易预测(极端事件越少),构建一个使机器人在这种环境下执行任务的软件就越简单。机器人能在工厂里广泛普及是因为大多数工厂都是一个封闭的世界、一个高度结构化的环境,在那里极端事件是能够预测的,而且会被工业工程师小心地排除。在封闭的环境中,机器人的工作职能会围绕特定任务进行设计。工厂里的机器人知道将会发生什么。指导它们运行的软件会引导机器人进行一系列一成不变的活动,例如冲压金属部件、固定螺栓,或者将箱子从一侧拉到另一侧。
1700043997
1700043998
虽然在工厂里可以设计一个整齐划一的封闭式环境,然而在实际环境中,街道和高速公路上是复杂混乱且难以预测的。汽车方向盘后的每个司机不仅要处理新的突发情况,还必须应对其他相关挑战,这些挑战是软件程序难以处理的,由模糊的或者高度情境化的行为规则调控的信息交互问题。人工智能软件尤其会在对安全驾驶有重要影响的两类活动中出现问题,即复杂的非语言信息沟通,和在多种情境中对同一物品进行持续正确识别。
1700043999
1700044000
驾驶行为要求司机和行人之间进行复杂的“社交”活动。当人类司机位于方向盘后面时,通常会参与到一场非语言的“社交芭蕾舞剧”中,并用点头、挥手、眼神交流来传达他们的意图。挥手和微笑对于人类而言可能是简单的,但是想要编写一套软件来识别人类的面部表情、身体语言并做出恰当的回应,则异常困难。
1700044001
1700044002
无人驾驶汽车,这一移动版机器人不仅在识别复杂的非言语交流上存在困难,当需要应对突发事件时,它们的计算机智能也会捉襟见肘。这些问题均是由知觉缺陷导致的,即它们不具备对所见事物进行感知区分并合理应对的能力。理想情况下,计算机科学家会通过编写一套程序来解决这个问题,为汽车提供一致性、准确的人工意识和情境理解能力。然而直到目前为止,这个问题还没有被解决,这样的软件还没有做出来。自从人工智能领域开辟半个多世纪以来,计算机科学家和机器学家为了实现“知觉”这一神秘技艺的自动化已经尝试了各种方法,但均未能取得突破性进展。
1700044003
1700044004
生物有机体的知觉系统包含了一系列广泛的能力。知觉中的一个方面就包含认知识别功能,人或动物因此具有“读取”复杂情境的能力,并知道如何正确地反应。知觉的另一个功能就是加工处理视觉信息。生命体具有高度发达的视觉系统,可以良好地识别一个物体,甚至是从不同的角度、在不同的光线条件以及不熟悉的情境中都可以准确识别同一个物体。
1700044005
1700044006
视觉感知需要对视觉信息进行正确识别并进行归类,人类在进行这样的过程时,纯粹依靠本能,而且几乎能够做到完美无误。然而,我们这种感知所见事物的能力似乎拒绝被自动化。几十年来,机器视觉领域的研究者一直在努力研发能够快速而准确地“理解”环境中视觉信息的软件,但均以失败告终。
1700044007
1700044008
在机器人发展史的大部分进程里,它们都难以处理视觉信息。工业机器人应对这一缺点的方式就是在全封闭、黑暗无光的工厂环境中纯机械化地辛勤工作。而对于那些工作中涉及某些视觉活动的机器人,它们的工作方式则被设定为绝不去分类或检查它们不熟悉的事物。
1700044009
1700044010
阻碍机器视觉软件发展的另一因素就是计算能力的不足。由于处理图像是一项数据密集型活动,所以第一代机器视觉系统只能采取一种结构化路径的方式来实现这一流程,即用一系列“规则”来解析视觉信息。这些早期机器视觉系统的工作原理是想尝试将识别的物体与机器人内部储存的已知物体小型样例库做匹配,但显然这是一个缓慢、不准确也不灵活的过程。
1700044011
1700044012
早期机器视觉软件的最大缺陷之一,就是它们在应对新鲜事物或情境时表现不佳。即便是很熟悉的物体,只要在略微不同的场景中出现,任何借助这类软件引导的机器人(或汽车)都无法进行准确识别。鉴于准确识别邻近物体这一能力对于安全驾驶至关重要,机器视觉软件的差劲表现数十年来一直阻碍着无人驾驶汽车的发展。然而,最近在人工智能领域的一项突破进展可能会彻底改变这一切。
1700044013
1700044014
在人工智能研究领域原地踏步多年之后,一种被称为“深度学习(Deep Learning)”的新型软件于2012年诞生了,它可以对随机的数千个数码图像信息进行准确分类,并达到人类水平的精准度。虽然对随机物体的图像进行准确分类的能力听起来无足轻重,但这一能力的确是人工知觉(Artificial Perception)的基础。一旦某个物体可以被精准识别,它的信息会被“转化”给其他类型的人工智能软件,而那些软件就可以发挥其传统优势:利用统计分析或某种逻辑、规则推导出最佳反应。
1700044015
1700044016
深度学习软件对于无人驾驶如此有价值,就是因为它可以在开阔公路这种非结构化的环境中充分发挥作用。深度学习隶属于“机器学习(Machine Learning)”这一类人工智能软件。这类软件的突破创新并非由人类程序员来设计,机器学习软件并不会去建立一个现实世界的模型,再用正常的逻辑和规则来处理其中的问题,相反机器是通过大量的训练数据后被“喂养”出来的。例如,为了开发无人驾驶所用的深度学习软件,程序员每天会用几千兆字节(Gigabyte,即GB)的原始视觉素材来“喂养”这个软件,而这些视觉素材都是通过车载摄像头在真实道路环境下的行驶中拍摄收集的。
1700044017
1700044018
深度学习软件通过观察世界来“学习”,这一点赋予了它另一巨大优势——不依赖规则(not rule-bound)。人类的婴儿学会依照物体的突出可识别性特征来识别物体,同理,深度学习软件在对物体分类时也是依据物体的视觉特征。使用规则依赖的传统途径编制的软件,遇到坐在自行车上的猫的图片时,就会陷入困惑。相反,深度学习软件会关注猫身上可供识别的视觉特征——尖耳朵和尾巴,然后不管这只猫是出现在一个多么奇怪的情境中,软件都会迅速而准确地推测出它只是一只猫。
1700044019
1700044020
深度学习软件已经彻底改进了对人工知觉的研究,并极其成功地应用到语言识别领域,以及其他需要软件来处理古怪异常信息的活动中。过去的几年里,为了寻求深度学习的专业技术支持,很多汽车公司都在硅谷设立了分部。谷歌和百度这些软件巨头本身已经具备了管理巨量信息和构建智能软件的能力,再加上深度学习领域的专业优势,足以支撑它们与曾经不可一世的汽车巨头在无人驾驶领域展开角逐。
1700044021
1700044022
深度学习对于人工智能领域的影响极其深远,甚至在我们写作本书时,其影响还在逐步拓展,而且未来几年可能会持续扩大。深度学习所引领的技术领域并不只是汽车一隅。我们预计,深度学习将会对移动类机器人的总体发展轨迹产生变革性影响。当机器人获得了通过视觉理解周遭环境的能力时,人工生命形态的发展可能会开始延续5亿多年前有机体生命发展的路径——化石显示大约在寒武纪以前,所有形态的有机体生命都是近乎眼盲的。当5亿多年前寒武纪开启时,那些近乎眼盲的有机体突然神秘地演化出了复杂的新型视觉系统,要知道先前它们的“眼睛”只是些光感性的原始细胞集。一旦它们具备了看的能力,这些简单的有机体随之演化出了复杂的身体形态,以便实现快速的反应和移动。反过来,新的身体机能又会需要发展一个更大号的大脑来监管这些新生肢体的协调。当装备上视觉系统、快速响应的身体以及更大的大脑时,曾经不起眼的细胞集演化出了种类繁杂的复杂生物,它们从最初生命的泥沼中爬出,并努力在陆地上寻求属于自己的一块领地。
1700044023
1700044024
关于寒武纪生命大爆发——发生在寒武纪时期的生命大量快速演化,有一个有趣假设,即“光开关理论(Light Switch Theory)”。这个理论是由安德鲁·帕克(Andrew Parker)提出的,该理论认为正是眼睛的进化,引发了生命体之间的进化竞赛,使得那些具备最佳视觉的生物才最有可能生存下来。也许“光开关理论”理论对于机器人也是适用的。
1700044025
1700044026
曾经“眼盲”的机器获得了知觉的能力,它们也会从原始的禁锢中爬出,摆脱现今我们为其设计的结构化的、黑暗的工厂环境。健全的机器视觉将使得机器人可以充分利用其新添加的身体部件——轮子、四肢或踏板,而那些部件能为它们提供更高水平的灵敏度。想要控制复杂的机械新“四肢”,它们的机器大脑也会随之扩张。当我们目睹机器人掌握了新的技能并找到可以发挥功效的新应用场景时,我们也终将见证机器人形态和功能的“寒武纪大爆发”。
1700044027
1700044029
迎接无人驾驶
[
上一页 ]
[ :1.70004398e+09 ]
[
下一页 ]