1700550198
1700550199
“感知器”并没有尝试做这么多的事情。它只想做简单的图像分类。这台机器有400个光电池,它们为刺激杂乱的机器大脑而随机连接到一层人造的神经元。通过这个神经网络的早期演示,以及罗森布拉特的自信预测,《纽约时报》在1958年报道说:“它是(海军)所希望的电脑的胚胎,它将会走路、谈话、观看、写作、复制自己并意识到自己的存在。”
1700550200
1700550201
然而,说好的突破并没有很快到来,1969年,马文·明斯基(Marvin Minsky)和西蒙·派珀特(Seymour Papert)发表了一篇题为“感知器:计算几何学导论”的毁灭性评论。他们以数学方式表明,罗森布拉特的设计不能完成一些基本的分类任务。对于人工智能领域的多数人来说,这足以让他们不仅疏远“感知器”,而且疏远神经网络和一般意义上的机器学习等广义概念。对于两个阵营的研究人员来说,人工智能的严冬降临了。
1700550202
1700550203
坚持总有回报
1700550204
1700550205
有几个团队继续研究机器学习,他们仍然相信,让电脑像人类一样思考的正确方法,就是建立可以通过实例学习的脑启发神经网络。这些研究人员终于了解并克服了“感知器”的局限性。他们的做法结合了高深的数学、功能更强大的电脑硬件和一种实用的方法,此举从大脑的工作方式获得启发,但又不受其约束。例如,电信号只能沿着大脑神经元的一个方向流动,而由保罗·沃伯斯(Paul Werbos)、杰夫·辛顿(Geoff Hinton)和扬·乐坤(Yann LeCun)等人在20世纪80年代建立的成功的机器学习系统则允许信息通过网络向前及向后传播。
1700550206
1700550207
这种“反向传播”带来了更好的表现,但进展仍然非常缓慢。到20世纪90年代,扬·乐坤开发的用于识别数字的机器学习系统阅读了美国20%的所有手写支票,但是几乎没有其他的现实应用。
1700550208
1700550209
阿尔法狗最近的胜利表明,现在的情况已经大不相同。诚然,阿尔法狗包含了对大量可能性的高效搜索,这是基于规则的人工智能系统的典型元素,但它的核心是机器学习系统。如其创建者所述,它是“一种新的电脑围棋方法,它使用深层神经网络,其训练融合了与人类专家对弈的监督式学习和自我对弈的强化式学习”。
1700550210
1700550211
阿尔法狗远不是一个孤立的例子。过去几年,神经网络处于蓬勃发展之中。它们现在是人工智能的主要类型,而且似乎有可能保持一段时间。由此,人工智能领域终于兑现了其早期的一些承诺。
1700550212
1700550213
为什么有人工智能
1700550214
1700550215
这个蓬勃发展的局面是如何发生的?为什么它来得如此之快,如此出人意料?通常情况下,这样的进步汇聚了一些因素,它既是恒力所致,也是机缘使然。许多业内人士认为,其中最重要的因素是摩尔定律。神经网络随着规模的增加而变得更加强大、多能,而且直到最近,规模足够大的神经网络才变得足够便宜,可供许多研究人员之用。
1700550216
1700550217
云计算帮助预算较小的项目开启了人工智能研究之路。技术企业家埃利奥特·特纳(Elliot Turner)估计,到2016年秋天,开展前沿性机器学习项目所需的计算能力可从亚马逊云服务(AWS)等云计算提供商那里租用,成本约为1.3万美元。奇怪的是,现代视频游戏的普及也大大推动了机器学习。驱动流行游戏机的专用图形处理器(GPU)非常适合神经网络所需的各种计算,因此被用于大量的相关任务。人工智能研究者吴恩达(Andrew Ng)告诉我们:“前沿的研究团队用图形处理器做了我两三年前无法想象的超级复杂的事情。”
1700550218
1700550219
对机器学习来说,与摩尔定律同等重要的是大数据,即数字化的文本、图片、声音、视频、传感器读数等在近期的大爆发。像幼童需要听很多词语和句子来学习语言一样,机器学习系统需要接触许多实例,以便改进语音识别、图像分类和其他任务。[6]我们现在有了有效的、源源不断的数据,而且随时都在生成更多的数据。辛顿、扬·乐坤和吴恩达等人建立的系统具有非常理想的性能,其性能随着接触越来越多的实例而日趋改善。关于这个美妙的现象,辛顿淡定地说:“回想起来,(机器学习的成功)只是数据量和计算量的问题。”
1700550220
1700550221
辛顿可能过谦了。他对神经网络的多项进展都有贡献,其中一项甚至使研究领域改名。2006年,他与西蒙·奥辛德罗(Simon Osindero)和郑怀宇(Yee-Whye Teh)合作发表论文《一种深度信念网络的快速学习算法》,表明足够强大并适当配置的神经网络本质上可以自己学习,无须人类的培训或监督。例如,如果阅读了大量的手写数字,这些网络就可以正确地推断10个不同的数据类型(对应于数字0到9),然后还可以准确地对其读到的任何新的手写数字分类,归入其所确定的10个类别。
1700550222
1700550223
在机器学习领域,这种无人监督的学习仍相对少见。最成功的系统依赖于监督式学习,在其中,系统被输入一组问题和配对的正确答案,然后被要求自己回答任何新的问题。例如,某个机器学习系统可能被输入一大组人类演讲的语音文件和相应的书面文本文件。该系统使用这组配对数据来建立神经网络的内部关联,使其能够解释新的录音实例。由于监督和无监督的机器学习方法都使用辛顿及其同事在2006年论文中描述的算法,所以它们现在通常被统称为深度学习系统。
1700550224
1700550225
演示和部署
1700550226
1700550227
除了扬·乐坤建立的用于识别支票上手写数字的系统等少量案例,深度学习的商业应用其实只有几年,但是这种技术正在以超常的速度传播。谷歌负责该项技术的软件工程师杰夫·迪恩(Jeff Dean)[7]指出,截至2012年,该公司还压根儿没有用它来改进搜索、Gmail、YouTube及Google Maps等产品。然而到了2015年第三季度,深度学习已经用于公司大约1 200个项目之中,超过了其他方法的表现。
1700550228
1700550229
DeepMind在深度学习与另一种被称为“强化学习”的技术相结合方面特别有效,[8]它不仅将注意力和技术放到公司向客户提供的信息产品上,而且还应用于物理世界的关键过程。谷歌运行着一些世界上最大的数据中心,它们是非常耗能的设施。建筑物必须向多达10万台服务器供电,同时保持冷却。冷却方面的挑战更加复杂,因为设施的计算负载(服务器被要求工作的总量)因时而异,无法预测。室外的天气也有关系,它显然影响了建筑物的冷却方式及冷却程度。
1700550230
1700550231
人通常控制着保持数据中心正确温度的泵、冷却器、冷却塔和其他设备。他们监测温度计、压力表和其他许多传感器,并随时间推移决定如何最好地冷却设施。DeepMind团队想看看是否可以用机器学习取而代之。他们拿来多年的历史数据,涵盖了数据中心的计算负载、传感器读数以及诸如温度和湿度之类的环境因素,然后使用这些信息训练一组神经网络,以此控制所有可用的冷却设备。在某种意义上,他们把数据中心看成巨大的视频游戏,并指示其算法尝试获得更高分数,在这里,分数意味着更好的能源效率。
1700550232
1700550233
有一个数据中心的实际控制权交给了这些系统,带来立竿见影、面目一新的结果。用于冷却的能源总量下降了40%,设施能耗(那些不直接用于信息技术设备的能源,包括辅助负载和电气损耗)改进了大约15%。DeepMind联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)告诉我们,这是谷歌数据中心团队见过的最大改进之一。
1700550234
1700550235
苏莱曼还强调,DeepMind的方法具有很高的可推广性。团队使用的神经网络无须为每个新的数据中心进行完全重新配置。神经网络只需要接受尽可能详尽的历史数据的训练。这种训练是微妙而艰巨的,[9]但回报是显而易见的。
1700550236
1700550237
事实上,目前投入使用的数据中心能源管理、语音识别、图像分类和自动翻译等机器学习系统中,那些表现最好的系统非常相似。它们都是深度学习的变体,不因应用领域而异。这一点很重要,因为它表明这种人工智能方法可以在各个行业和经济体中迅速扩散。新的神经网络可以复制,几乎可以立即扩充,并接受新数据的训练,然后得以应用。
1700550238
1700550239
包括微软、亚马逊、谷歌和IBM在内的科技巨头通过云和应用程序编程接口的组合,将其内部开发的机器学习技术提供给其他公司,这些应用程序编程接口是关于软件如何交互的基本明确的、一致的公开规则。应用程序编程接口使不同来源的代码整合到单个应用程序变得更加容易,而云则可以在全球范围内按需提供该代码。
1700550240
1700550241
通过这种基础架构,机器学习有机会在全球范围内快速而深入地进行部署。然而,由于第一章所讨论的原因,我们也预期,随着领先企业的业务流程重组和新商业模式的出现,机器学习会不均匀地传播。它已经在一些意想不到的地方发生了。
1700550242
1700550243
小池真野(Makoto Koike)2015年回到父母在日本的黄瓜农场时,看到了应用机器学习的机会。他以前曾是汽车行业的硬件和软件工程师,善于开发代码和机械相结合的设备。小池发现自己的才能可以用在黄瓜分选工作中,这本是他母亲一手包办的活计。她根据多年的经验将农场的所有农产品手工分为9个品级。因为农场很小,所以她能做好(日本的非谷类农场平均只有1.5公顷,面积约为一个半棒球场或两个足球场),但这是件苦力活,在收获旺季期间,每天要工作8个小时。
1700550244
1700550245
小池对阿尔法狗的模式匹配能力印象深刻,对谷歌2016年11月推出的机器学习技术包TensorFlow也非常着迷。他决定使用它们,看看能否将家庭农场的黄瓜分选工作自动化。小池之前没有机器学习方面的经验,但自学了如何使用TensorFlow,接着用7 000张不同等级的黄瓜图像对系统进行了培训。他用现成的廉价相机、电脑和硬件控制器组装了一个全自动的评分机器,第一年运行达到了70%的准确率。几乎可以肯定,利用更高分辨率的图像和下一代的云端机器学习软件,就能实现更高的准确率,小池说:“我迫不及待地想试一把。”鉴于他和其他人的工作,我们同意谷歌公司佐藤贺(Kaz Sato)的说法:“毫不夸张地说,机器学习和深度学习的应用只受我们想象力的限制。”
1700550246
1700550247
直至我们写这本书时,人工智能领域几乎所有的商业成功例子都使用监督式学习技术,也有少数使用了强化学习技术(例如DeepMind优化的数据中心)。然而,人类学习的主要方式是无监督的学习。蹒跚学步的小孩学习日常生活中的物理,靠的是玩积木、从玻璃杯倒水、扔球、从椅子跌落等,而不是靠学习牛顿的运动定律或记住“F= ma”之类的方程。扬·乐坤用一个蛋糕的比喻,生动地强调了无监督学习尚未触及的广泛而重要的内容。他说:“如果智能是一个蛋糕,那么无监督学习就是蛋糕本身,监督式学习只是蛋糕上的糖衣,而强化学习则是蛋糕上的樱桃。我们知道如何制作糖衣和樱桃,但我们不知道如何制作蛋糕。”他认为,如果我们要实现通用人工智能,那么开发更好的无监督学习算法将是至关重要的。
[
上一页 ]
[ :1.700550198e+09 ]
[
下一页 ]