打字猴:1.700044641e+09
1700044641
1700044642
1700044643
1700044644
1700044645 无人驾驶:人工智能将从颠覆驾驶开始,全面重构人类生活 [:1700043788]
1700044646 无人驾驶:人工智能将从颠覆驾驶开始,全面重构人类生活 第四章  创建人工识别
1700044647
1700044648 无论是底层控制系统还是上层控制系统,都无法赋予机器人从视觉上识别周围环境并做出恰当反应的能力。因此,直到最近,人工智能也未能为汽车提供极为可靠的人工识别。
1700044649
1700044650 2015年,黑客乔治·霍兹(George Hotz)发表声明,称只用了一个月的时间,就在自家车库成功改装了一辆无人驾驶汽车。激光雷达、摄像机以及能塞进储物箱内的电脑、网络交换机和GPS传感器,霍兹用这些寻常的设备改装了一辆2016年版的本田讴歌ILX(Acura ILX)。按照霍兹的说法,他的无人驾驶汽车运行状况良好。霍兹还夸口表示,再经过几个月的改进和实践,引导这辆改装版讴歌汽车运行的软件在运作性能上会超越特斯拉S型车(Tesla S)的定速自动行驶模块。
1700044651
1700044652 特斯拉的CEO埃隆·马斯克对霍兹的公开挑战并没有置之一笑,而是在特斯拉网站上郑重其事地向霍兹说明了自动驾驶的真正难题:
1700044653
1700044654 把机器学习系统做到99%的准确率相对简单,但是在这个基础上再提升0.9999%的准确率却非常难,而这0.9999%才是根本性的需求。去看看每年一度的机器视觉竞赛就能知道其中缘由了,电脑在判断什么东西是狗的问题上准确率可以高达99%以上,但可能偶尔也会把盆栽植物错认为狗。如果在以每小时70英里的速度行驶时犯下这种错误,那么后果将十分严重。
1700044655
1700044656 霍兹和马斯克之间的争论,恰恰体现了人工识别软件的价值所在——无人驾驶汽车目前还缺失的核心组件,这还表明了这个组件的发展对于无人驾驶汽车能否真正走向市场有多重要。霍兹成功改装讴歌的事迹,证明了如今一个熟练的开发人员在短时间内便可搭建一辆“不错”的无人驾驶汽车。然而,正如马斯克所说,当需要人们对软件托付生命时,让它的准确率从99%提升到99.9999%才是质的飞跃。
1700044657
1700044658 在过去的几年中,移动机器人在定位周边环境方面表现得越来越好。得益于大数据、高分辨率数码相机和更快速的处理器的出现,计算机视觉软件的性能已有了显著改善。另一个催化剂便是机器学习软件的成功应用,解决了机器视觉的一些棘手问题,进而引发了一场人工识别研究的复兴。
1700044659
1700044660 无人驾驶汽车技术的最后难关仍然是开发软件来监管汽车的感知和反应。在编写这本书时,我们遇到了一个十分困惑的问题——应该如何称呼这些不能完全归属于底层控制或者上层控制领域的各种新兴软件工具包。思考一番之后,我们索性将这些软件归属到名为“中层控制(Midlevel Controls)”的领域。
1700044661
1700044662 在这一章中,对于为汽车提供人工识别和智能反应的各种软件工具,我们用“中层控制软件”这个短语来指代。中层控制软件使得汽车的操作系统能识别传感器数据,感知车辆周围环境的实体布局,并针对周围事物或事件做出最佳反应方案。平均而言,中层控制涉及的事件持续时间——机器人专家所称的“事界(Event Horizon)”——从几秒钟到几分钟不等。相比而言,底层控制运行的事界不到1秒钟,而上层控制运行的事界则需几个小时。
1700044663
1700044664 对于人类来说,中层控制活动的一个事例可能相当于从水槽中拿起一个脏的咖啡杯放进洗碗机。诸如CHIMP这样的灾难恢复机器人,中层控制活动的事件可能是视觉传感器发现并确认了地面上存在一个圆形黑色物体。CHIMP的控制软件会将其归类为石头(而不是像影子一样的东西),并且指导机器人的履带安全绕过它。一辆无人驾驶汽车的中层控制活动可能涉及物体形态、状态的识别,即当识别到人行道有个正在骑自行车通过的人时,会让他先行通过,而发现前方道路上突然出现的是个被风吹动的塑料袋时就不会转弯避让。
1700044665
1700044666 无人驾驶:人工智能将从颠覆驾驶开始,全面重构人类生活 [:1700043789]
1700044667 物体识别的挑战
1700044668
1700044669 中层控制软件需要指导无人驾驶汽车,穿行于具有无限可能性的复杂真实情景中。想要体会研发人员所面临的艰巨挑战,只需想象一下编写软件来指导汽车通过一个繁忙的十字路口是何感觉。既然软件应该与一个驾驶员保持相同的标准,那么它就必须遵守车辆管理局制定的一系列标准化交通规则。
1700044670
1700044671 减速、准备停车、避让已经在十字路口或刚进入十字路口的机动车辆和行人。而且,还需避让排在前面的机动车辆和自行车,以及在右边道路上同一时间到达十字路口的机动车辆和自行车。
1700044672
1700044673 很简单,对吗?但当你将过程步骤分解,问题就变得略微复杂了。第一个任务是编写代码使汽车能够“意识到”即将抵达十字路口,这样它可以“放慢脚步,准备停车”,这一过程可以通过设计GPS定位点和包含十字路口详细信息的数字地图来实现。停车标志或者红灯这样的视觉线索也能起到一定帮助。这一步实际上还没有什么特别难的问题。
1700044674
1700044675 现在开始转向下一个任务:避让已经在十字路口或刚进入十字路口的机动车辆和行人。在这一点上,问题开始变得棘手了。首先,什么算是“机动车辆”?软件如何能识别出“行人”这一类群体呢?
1700044676
1700044677 为了达到人类驾驶员的驾驶效果,我们假设中层控制软件必须通过某种方式正确地将机动车辆、行人或自行车进行归类。解决这个问题的一种方法是基于规则方法编写一个人工智能程序。为了将无人驾驶汽车可能会遇到的每一种行人、机动车辆和具体交通状况归类,我们必须编写一个尽量详尽的清单,也就是程序员称之为“如果-则编程语句(if-then statements)”。
1700044678
1700044679 现在转向下一个问题:你必须通过某种方式描述这些类别,软件才可以识别它们。识别“机动车辆”或“行人”这些分类的一种方式,可能是根据它们看起来更像是什么。例如,机动车辆是“10~20英尺长的矩形物体”,行人是“2英尺宽度以内、2~7英尺高度的两条腿物体”。
1700044680
1700044681 对于在过去几十年内一直致力于研究人工智能的研究人员来说,类别定义方式并非在任何情境下都适用。不可避免地会出现一些特殊情况,让精心构建的最全面的如果-则编程语句失策。例如在十字路口,一个行人可能拄着拐杖,另一个行人可能携带着笨重的包裹,这样他们的总宽度就会增加而超过2英尺;又或者一辆7英尺长的摩托车(因太短而不会被当作汽车)在十字路口呼啸而过,但是软件无法将其识别为机动车辆。
1700044682
1700044683 基于规则编写的人工智能软件的核心问题在于,如果没有一个概括性的方法将汽车可能遇到的一切情况进行分类,那么也就无法编写出指导汽车作出反应的全面规则。
1700044684
1700044685 由于我们的软件无法每次都准确识别遇到的是汽车还是自行车,所以它也就无法按照道路规则给汽车提供适当反应的建议。这就是研发人员为什么会说这样的话——
1700044686
1700044687 如果生活总是条理清晰,那么编写中层控制软件就很简单。但事实并非如此,在任何一个城市的任何一条繁忙的街道,总是会出现各种新奇的个案超出人们事先的界定。之所以我们总认为感知活动理所当然,再简单不过,是因为人类已经掌握了感知这一复杂的艺术。
1700044688
1700044689 Palm公司的创始人杰夫·霍金斯(Jeff Hawkins)在他的著作《智能时代》(On Intelligence)里列出了机器感知领域最持久的难题之一:不变性识别(Invariant Representation)。不变性识别是指我们的大脑具备准确辨认同一图像、声音或感觉的能力,即使是在陌生的环境遇到它们或者从一个新的角度体验它们。不变性识别的一个事例便是我们总是能在一瞬间认出朋友的脸,即使她把金色的头发染成了黑色。
1700044690
[ 上一页 ]  [ :1.700044641e+09 ]  [ 下一页 ]