1704610117
1704610118
忽然之间,各个领域都取得了突破性的进展。例如,人们发明了专门用于预测股市的神经网络。大多数情况下,投资公司使用不同的网络预测不同的股票,然后由交易商来决定投资哪只股票。然而,有些人在此基础上更进一步,赋予网络本身自主权,使其能够自行买卖。无独有偶,金融领域迅速涉足电子游戏领域,时刻准备着为人工智能研究人员进行投资。算法交易时代轰轰烈烈地开始了。
1704610119
1704610120
当时神经网络领域的另一个引人注目的应用就是自动驾驶汽车。发明自动驾驶汽车一直是技术人员的梦想。1925年,发明家弗朗西斯·霍迪纳(Francis Houdina)展示了一款无线电控制的汽车,他操控汽车行驶在曼哈顿的街头,而车中无须人来操控方向盘。之后,自动驾驶汽车测试使用导丝和车载传感器使汽车能够按照路上画好的白线行驶,或通过识别出地下电缆发出的交流电行驶。1969年,约翰·麦卡锡发表了一篇标题为“计算机控制汽车”的论文极具挑战性。麦卡锡所提议的方案基本上是设计一个“自动化司机”。他的项目需要一个能够进行公路导航的计算机,计算机上仅带有一个电视摄像机来输入信息,该输入使用与人类司机相同的视觉输入。麦卡锡假设用户能够使用键盘输入地点,并要求汽车立即载他们过去。紧急情况下,用户可以使用额外的命令变更目的地,要求汽车停在洗手间或宾馆门口,在有紧急情况时减速或加速。
1704610121
1704610122
类似的项目直到20世纪90年代早期才得以实现,当时卡内基—梅隆大学的研究人员迪安·波默洛(Dean Pomerleau)写了一篇激动人心的博士论文,文章介绍了如何将“反向传播”应用于无人驾驶汽车。波默洛称其开发的神经网络为神经网络中的无人驾驶汽车或ALVINN(控制器),并将道路上的原始图像作为输入信息,并实时输出转向控制信息。当时,还有许多其他传统人工智能博士正在研究类似的自动驾驶项目。这些非神经网络的方法主要通过严谨的像素分析将各图像划分为不同类别,例如“道路”和“非道路”。然而,与许多传统人工智能面临的问题一样,计算机很难将信息解析为像实时路况那样的非结构化信息。假如一辆自动驾驶汽车依靠这一技术进行危险的高速行驶,发生事故的可能性是很大的。波默洛回忆道:“它们可能将树影或者树木本身识别成道路,这样车辆就会朝着树直接开过去,而不是避让。”
1704610123
1704610124
为了训练ALVINN,驾驶员只需简单地驾驶一段路程。波默洛说道:“驾驶员只需驾驶2—3分钟,ALVINN系统就能够了解并更新反向传播网络的权重。结束驾驶时,驾驶员可以放开方向盘,系统会继续驾驶车辆开始一段新的路程。”波默洛的发明只关注了方向,却无法控制速度或避开障碍物,这两点必须由驾驶员来完成。尽管如此,波默洛也取得了巨大的成功,1995年,庞蒂克小型货车上安装了从旧汽车上回收的ALVINN的升级版——RALPH(快速调节横向位置处理器)。波默洛和一位名为托德·约赫姆(Todd Jochem)的研究人员为其配备了一台电脑、640×480像素的彩色照相机、全球定位系统接收器和光纤陀螺仪,之后他们驾驶该车横穿美国。借鉴了1986年“携手美国”(Hands Across America)慈善活动的名称,他们将这次旅行称为“横穿美国”(NO Hands Across America)。他们在路上卖10美元一件的衬衫,用于支付食宿费用。最后,这辆汽车一共行驶了2 797英里,途经匹兹堡、宾夕法尼亚、圣地亚哥、加利福尼亚,中间还穿过了胡佛水坝,这一切都是汽车自动驾驶完成的。《商业周刊》的一位记者在报道这一事件时,一名堪萨斯州骑兵要求其将车停到路边。而波默洛和约赫姆乘自动驾驶汽车旅行,甚至连双手都无须握住方向盘。
1704610125
1704610126
15年后,谷歌在2010年10月发布了自己的无人驾驶汽车项目。然而,我们仍要感谢波默洛在神经网络领域做出的开创性贡献,他证明了自己的观点。
1704610127
1704610128
1704610129
1704610130
1704610132
人工智能:改变世界,重建未来 欢迎来到深度学习领域
1704610133
1704610134
神经网络在21世纪中叶迎来了又一次重大进展。2005年,杰夫·辛顿在多伦多大学任教,此前不久,他一直在英国伦敦大学学院工作,在那里建立了盖茨比计算神经科学组。这时,人们已经清楚地认识到,互联网能够生成大量数据集,这在10年前是想都不敢想的。如果说以前的研究人员面临的问题是没有足够的数据来对系统进行适当的训练,那么互联网的兴起则大大改善了这一状况。如今,据国际数据公司等研究公司估测,目前网上在线数据量约为4.4泽字节[1]。记者史蒂夫·洛尔(Steve Lohr)在其所著的极为有趣的《数据论》一书中指出,如果能将这些数据输入iPad Air(苹果超薄平板电脑)中,那么产生的堆栈将能够覆盖地球到月球距离的2/3。
1704610135
1704610136
然而,就像地球虽然有大量的水,但并不是所有水都可以喝一样,这些数据中好多都是未标记的。当数据集较小时,研究人员可以将主要精力放在正确标记所有数据上,这对训练系统来说更加有用。然而,随着数据量的增加,研究人员就无法再这样做。例如,2013年3月,网络相册Flickr共有8 700万注册用户,他们每天上传超过350万张新图片。从理论上看,这对那些想要建造一个能够识别图片的神经网络的人们来说是一个天大的好消息,但同样也提出了挑战。正如我们所看到的,训练神经网络最简单的方法就是向其展示大量图片,然后指出每张图片都是什么。通过标记图片,训练员既提供了输入(图片),又提供了输出(描述)。神经网络就可以反向传播,以纠正错误。这就是我们所了解的“监督式学习”。但是,流通中还有许多未标记或没有正确标记的图片,计算机如何对其进行识别呢?
1704610137
1704610138
幸运的是,杰夫·辛顿掀起了一场“非监督式学习”的革命,这种学习方式无须向计算机提供任何标记。机器能够访问的只有输入,无须解释它看到的是什么。首先,这听起来像是机器无法通过这种方式学习。如果没有得到明确的解释,即使是最智能的神经网络也不会知道某物到底是什么。实际上,辛顿发现的是“非监督式学习”可以用来训练上层特征,而且每次只能训练一层。这一发现成为“深度学习”的催化剂,而“深度学习”就是当前人工智能最炙手可热的领域。
1704610139
1704610140
我们可以将深度学习网络想象成工厂的一条生产线。输入原材料后,它们将随着传送带向下传递,后续的各个站点或层会分别提取不同的高级特性。为了继续完成一个图像识别网络的案例,第一层将用来分析像素亮度。下一层将根据相似像素的轮廓来确定图中存在的所有边界。之后,第三层将用来识别质地和形状等。到达第四层或第五层时,深度学习网络已经创建了复杂特性检测器。这时,它就能够了解4个轮子、挡风玻璃和排气管通常是同时出现的,眼睛、鼻子和嘴也是同时出现的。它不知道的仅仅是汽车和人脸都是什么样的。深度学习网络能够识别的许多特性可能都和手头的任务无关,但是其中有一些特性却是和手头任务高度相关的。
1704610141
1704610142
辛顿解释道:“训练这些特性检测器时,每次训练一层,这一层都试图在下面一层找到结构模式。之后,就可以在顶部贴上标签并使用反向传播来进行微调。”结果深深震撼了人工智能界。辛顿回忆道:“其中涉及一些数学问题,这总会给人们留下深刻的印象。”
1704610143
1704610144
有关深度学习的消息迅速传开。辛顿实验室的两名成员乔治·达尔(George Dahl)和阿卜杜勒–拉赫曼·穆罕默德(Abdel-rahman Mohamed)迅速论证了该系统不仅能够进行图像识别,还能够进行语音识别。2009年,俩人将其新创建的语音识别神经网络与已经使用了30多年的行业标准工具放到一起一较高下,结果是,深度学习网络获得了胜利。这时,谷歌邀请辛顿的一位博士生纳瓦迪普·杰特列(Navdeep Jaitly)修补谷歌的语音识别算法。看了一眼之后,他建议用深度神经网络取代整个系统。尽管一开始持怀疑态度,但杰特列的老板最终同意让他尝试一下。事实证明,新的程序比谷歌精心调试数年的系统表现还要出色。2012年,谷歌将深度学习语音识别程序嵌入安卓移动平台,错误率与之前相比立刻下降了25%。
1704610145
1704610146
那年夏天,辛顿终于收到了谷歌的电话。这个搜索巨头邀请他夏天到位于加利福尼亚州山景城的校园工作。尽管辛顿当时已经64岁了,谷歌却将他定为“实习生”,因为员工必须严格服从公司政策,即必须在公司工作好几个月之后才能被授予“访问科学家”的头衔。尽管如此,辛顿仍然加入了由20岁出头的年轻人组成的实习生组。他甚至还戴上了新实习生们专用的上面带有螺旋桨图案的帽子,被称作“新谷歌人”(Nooglers)。辛顿说:“我一定是史上最老的实习生。”当时,他开玩笑似的表示,那些并不知道他是谁的年轻同事肯定是把他当作“老笨蛋”了。
1704610147
1704610148
辛顿在谷歌的工作涉及为其他潜在的应用提出有关深度学习的建议。那年夏天的工作进展得十分顺利,第二年,谷歌正式聘用了辛顿。除他之外,谷歌还聘请了他的两名研究生,辛顿和这两名研究生共同创建了一家名为“DNNresearch”的公司。辛顿在一篇声明中写道:“我会继续在多伦多大学兼职任教,在那里我还有很多出色的研究生,但是在谷歌我能够看到我们如何处理超大型计算。”
1704610149
1704610150
在神经网络领域孤独地耕耘了30年后,杰夫·辛顿最终在世界最大的人工智能公司发挥了重要作用。
1704610151
1704610152
1704610153
1704610154
1704610156
人工智能:改变世界,重建未来 人工智能新主流
1704610157
1704610158
如今,深度学习神经网络已经成为人工智能的主流,其强调的理念可以追溯到麦卡洛克和皮茨。尽管该理念仍然是对大脑工作模式的一种模拟(我们将在后续章节中探讨更多关于大脑的生物力学模型),但神经网络能够解决问题的广泛性却令人惊叹。传统人工智能一直表现良好,直到后来研究人员才发现现实世界与其完美模型并不匹配。与传统人工智能不同的是,神经网络不仅能够处理规律性事物,还能够处理规则以外的情况。正如20世纪80年代的NETtalk一样,这使其成为处理语言等棘手问题的最佳选择。深度学习神经网络还擅长处理所谓的“分布表征”,这意味着其具有模拟同一表征空间中两个相似但独立的领域(例如语言和图像)的能力。从本质上来讲,这意味着神经网络能够以类比的方式进行思考,这一点是传统人工智能无法企及的。
1704610159
1704610160
杰夫·辛顿说道:“现在我们看到的许多事物都在使用神经网络。根据经验,如果你想完成一项任务,并且你知道这项任务涉及大量知识,这意味着如果你要学着做这件事,你将需要大量相关的参数。在这种情况下,深度学习将是更好的选择。”
1704610161
1704610162
令人印象深刻的应用程序随处可见。2011年,就在辛顿加入谷歌之前的那个夏天,谷歌工程师杰夫·迪安(Jeff Dean)、格雷格·科拉多(Greg Corrado)和斯坦福大学计算机科学家吴恩达(Andrew Ng)共同推出了“谷歌大脑”(Google Brain)项目。谷歌大脑项目都在谷歌公司半公开的实验室“谷歌X”中进行,使用深度学习网络识别高水平概念,例如通过分析视频网站YouTube的视频中静止的图像来识别猫,而之前并不向它解释猫到底是什么。(巧合的是,这实际上就是弗兰克·罗森布拉特半个世纪前对《纽约客》杂志说过的“神经网络终有一天能够实现”的那个目标。)
1704610163
1704610164
听起来一台知道猫为何物的计算机并没有什么新奇的,但是通过深度学习实现计算机的视觉能力,在现实世界中却拥有广泛的用途。一家名为“Dextro”的初创企业使用深度学习创造出了更好的在线视频搜索工具。Dextro的神经网络并不依靠关键词标签,而是通过扫描直播的视频来分析音频和图像。举例来说,如果用这个神经网络搜索英国前首相戴维·卡梅伦,那么不仅能够搜出与保守党有关的视频,就连提到英国首相的视频也能够搜到。
1704610165
1704610166
与此同时,Facebook(脸谱网)使用深度学习自动为图像设置标签。2014年6月,这一社交网络平台发布了一篇文章,介绍其称之为“DeepFace”的面部识别技术。凭借深度学习的能力,Facebook算法几乎和人脑一样准确,无论光线和相机角度如何,都能够对比两张照片并查看其显示的是否是同一个人。此外,Facebook还使用深度学习创建了另外一种技术,该技术能够为盲人用户描述图像,例如,一张图片上显示的是某人在一个夏日骑着自行车穿过英国的乡间小路,该技术能够用语音将这一情景描述出来。
[
上一页 ]
[ :1.704610117e+09 ]
[
下一页 ]