打字猴:1.700550228e+09
1700550228
1700550229 DeepMind在深度学习与另一种被称为“强化学习”的技术相结合方面特别有效,[8]它不仅将注意力和技术放到公司向客户提供的信息产品上,而且还应用于物理世界的关键过程。谷歌运行着一些世界上最大的数据中心,它们是非常耗能的设施。建筑物必须向多达10万台服务器供电,同时保持冷却。冷却方面的挑战更加复杂,因为设施的计算负载(服务器被要求工作的总量)因时而异,无法预测。室外的天气也有关系,它显然影响了建筑物的冷却方式及冷却程度。
1700550230
1700550231 人通常控制着保持数据中心正确温度的泵、冷却器、冷却塔和其他设备。他们监测温度计、压力表和其他许多传感器,并随时间推移决定如何最好地冷却设施。DeepMind团队想看看是否可以用机器学习取而代之。他们拿来多年的历史数据,涵盖了数据中心的计算负载、传感器读数以及诸如温度和湿度之类的环境因素,然后使用这些信息训练一组神经网络,以此控制所有可用的冷却设备。在某种意义上,他们把数据中心看成巨大的视频游戏,并指示其算法尝试获得更高分数,在这里,分数意味着更好的能源效率。
1700550232
1700550233 有一个数据中心的实际控制权交给了这些系统,带来立竿见影、面目一新的结果。用于冷却的能源总量下降了40%,设施能耗(那些不直接用于信息技术设备的能源,包括辅助负载和电气损耗)改进了大约15%。DeepMind联合创始人穆斯塔法·苏莱曼(Mustafa Suleyman)告诉我们,这是谷歌数据中心团队见过的最大改进之一。
1700550234
1700550235 苏莱曼还强调,DeepMind的方法具有很高的可推广性。团队使用的神经网络无须为每个新的数据中心进行完全重新配置。神经网络只需要接受尽可能详尽的历史数据的训练。这种训练是微妙而艰巨的,[9]但回报是显而易见的。
1700550236
1700550237 事实上,目前投入使用的数据中心能源管理、语音识别、图像分类和自动翻译等机器学习系统中,那些表现最好的系统非常相似。它们都是深度学习的变体,不因应用领域而异。这一点很重要,因为它表明这种人工智能方法可以在各个行业和经济体中迅速扩散。新的神经网络可以复制,几乎可以立即扩充,并接受新数据的训练,然后得以应用。
1700550238
1700550239 包括微软、亚马逊、谷歌和IBM在内的科技巨头通过云和应用程序编程接口的组合,将其内部开发的机器学习技术提供给其他公司,这些应用程序编程接口是关于软件如何交互的基本明确的、一致的公开规则。应用程序编程接口使不同来源的代码整合到单个应用程序变得更加容易,而云则可以在全球范围内按需提供该代码。
1700550240
1700550241 通过这种基础架构,机器学习有机会在全球范围内快速而深入地进行部署。然而,由于第一章所讨论的原因,我们也预期,随着领先企业的业务流程重组和新商业模式的出现,机器学习会不均匀地传播。它已经在一些意想不到的地方发生了。
1700550242
1700550243 小池真野(Makoto Koike)2015年回到父母在日本的黄瓜农场时,看到了应用机器学习的机会。他以前曾是汽车行业的硬件和软件工程师,善于开发代码和机械相结合的设备。小池发现自己的才能可以用在黄瓜分选工作中,这本是他母亲一手包办的活计。她根据多年的经验将农场的所有农产品手工分为9个品级。因为农场很小,所以她能做好(日本的非谷类农场平均只有1.5公顷,面积约为一个半棒球场或两个足球场),但这是件苦力活,在收获旺季期间,每天要工作8个小时。
1700550244
1700550245 小池对阿尔法狗的模式匹配能力印象深刻,对谷歌2016年11月推出的机器学习技术包TensorFlow也非常着迷。他决定使用它们,看看能否将家庭农场的黄瓜分选工作自动化。小池之前没有机器学习方面的经验,但自学了如何使用TensorFlow,接着用7 000张不同等级的黄瓜图像对系统进行了培训。他用现成的廉价相机、电脑和硬件控制器组装了一个全自动的评分机器,第一年运行达到了70%的准确率。几乎可以肯定,利用更高分辨率的图像和下一代的云端机器学习软件,就能实现更高的准确率,小池说:“我迫不及待地想试一把。”鉴于他和其他人的工作,我们同意谷歌公司佐藤贺(Kaz Sato)的说法:“毫不夸张地说,机器学习和深度学习的应用只受我们想象力的限制。”
1700550246
1700550247 直至我们写这本书时,人工智能领域几乎所有的商业成功例子都使用监督式学习技术,也有少数使用了强化学习技术(例如DeepMind优化的数据中心)。然而,人类学习的主要方式是无监督的学习。蹒跚学步的小孩学习日常生活中的物理,靠的是玩积木、从玻璃杯倒水、扔球、从椅子跌落等,而不是靠学习牛顿的运动定律或记住“F= ma”之类的方程。扬·乐坤用一个蛋糕的比喻,生动地强调了无监督学习尚未触及的广泛而重要的内容。他说:“如果智能是一个蛋糕,那么无监督学习就是蛋糕本身,监督式学习只是蛋糕上的糖衣,而强化学习则是蛋糕上的樱桃。我们知道如何制作糖衣和樱桃,但我们不知道如何制作蛋糕。”他认为,如果我们要实现通用人工智能,那么开发更好的无监督学习算法将是至关重要的。
1700550248
1700550249 人脑与学习机
1700550250
1700550251 我们不止一次听到,当代神经网络的开发者不情愿地将以前基于规则的方法称为过时的“特征工程”。许多人现在认为,那种试图将所有相关规则纳入任务,然后将它们编入电脑的方法是误导。他们相信,建立可以自己学习规则的系统显然更有成效。人工智能研究者的统计学阵营现在居于优势地位,其至少兑现了该学科半个多世纪前做出的一些承诺。
1700550252
1700550253 在这种情况下,人脑和机器将如何融合在一起?有几种不同的方式。一种方式是沿着保罗·米尔和汤姆·达文波特在前一章倡导的方式,将两者结合,让拥有常识的人类监视人工智能的决策和行为,并在发现错误时出手干预。这是DeepMind神经网络接管数据中心的优化工作时所做的。人类控制员总在决策过程之中,能够随时接管控制。
1700550254
1700550255 截至目前,引进自动驾驶技术的汽车制造商也采取这种做法。它们强调,人坐在驾驶员座位既是字面所指,也是形象所在,即使启用了自主驾驶技术,人也要负责汽车的安全运行。决策过程中总有人在,这在许多人看起来是稳健的,因为稍有不慎就会致命。2016年夏天,乔书亚·布朗(Joshua Brown)驾驶的特斯拉汽车撞在一辆卡车的拖车旁边,他死于非命。这辆带白色拖车的卡车当时正准备左转,从高速公路驶入地面公路。布朗在高速公路另一边迎着卡车行驶。特斯拉汽车在撞车之前并没有启动刹车,很明显,由于迎着明亮的佛罗里达天空,布朗和汽车的摄像头都没有发现白色拖车。也许布朗在许多先例中看到了自动驾驶系统有效的运行能力,对它过于自信了,于是对道路的关注越来越少。
1700550256
1700550257 谷歌认为,人为疏忽是一直存在的问题,所以人要完全脱离驾驶的决策过程。正如该公司自动驾车项目前任主管克里斯·乌尔森(Chris Urmson)所说:“传统的观念认为,我们只是采用这些驾驶员辅助系统,推动它们,并逐步改良它们,随着时间的推移,它们会自动驾驶车辆。嗯,我在这里告诉你,这就像我说‘如果我拼命学跳高,终有一天我能飞起来’。实际上,我们需要做一些稍微不同的事情。”因此,该公司正在努力打造100%的自动驾驶汽车,它们不需要人为干预,业内称之为“第5级自主权”。
1700550258
1700550259 这些汽车的能力给人留下深刻印象。正如乌尔森在2015年TED(技术、娱乐、设计)大会上所说,“我们的车辆正在驶过山景城,这就是我们所遇到的。这是一位坐在电动轮椅上的女士,她在路上绕圈追鸭子。现在,事实证明,美国车辆管理局手册没有告诉你如何应对这种情况,但我们的车辆能够处理——减速,然后安全行驶”。在所有情况和条件下都可以安全驾驶的自主汽车尚未面世,但我们认为它们很快就会出现。
1700550260
1700550261 机器语言攻克波兰尼悖论的能力开始被用于后台的白领工作。迄今为止,这类工作对完全自动化具有惊人的抵抗力。后台是知识性工作的一个广泛术语,它发生在客户的视线之外,包括采购、会计和信息技术等。如前所述,后台工作中任务量最大、标准化程度最高的元素早就被企业信息系统自动化了,但是在大多数企业中,仍然有大量的手工作业。
1700550262
1700550263 把这些工作部分自动化的一种方法,就是向从事这些工作的人询问他们使用什么规则、这些规则有什么例外、什么时候会改用不同的规则或指南,等等。然而,通过面谈抽取知识的过程耗时甚多,会使人没法干活,而且也可能不奏效。从事非日常性后台工作的人很可能无法准确、完整地告诉别人如何做好自己的工作。
1700550264
1700550265 日本富国保险公司用的是不同的方法。2016年12月,该公司宣布了一项使用IBM的人工智能沃森的计划,旨在使人类医疗保险索赔处理工作实现部分自动化。系统将首先从医院和其他保健服务提供商提供的文件中提取相关信息,并把它编入适当的保险理赔代码,然后将信息提供给人工。但是从长远看,系统的目的是“学习付款评估的历史,以便继承评估员的工作经验和专业知识”。换句话说,技术将边用边改进,久而久之,它将能够接管更多的人类工作。
1700550266
1700550267 我们期待今后有更多类似的工作,期待深度学习和其他机器学习方法能迅速传播。例如,客户服务的大部分工作是倾听并了解客户所想,然后向他们提供解答或者服务。一旦现代技术学会了交流的规则,它们就可以接管后一项工作。
1700550268
1700550269 但是,客户服务自动化最难的那部分还没有解决方案,即倾听和理解。基于本章在前面讨论的各种原因,语音识别和自然语言处理的其他方面一直是人工智能诞生之后面临的非常棘手的问题。以前居于主导的符号型方法根本没有奏效,而基于深度学习的新方法的进展却如此迅速,甚至令专家也感到惊讶。
1700550270
1700550271 2016年10月,微软研究团队宣布,他们建立的神经网络已经实现了“交谈时的语音识别方面与人类平起平坐”,一如其论文标题所示。无论是给定主题的讨论还是朋友家人之间的开放式对话,该系统都比专业的记录员更准确。语言学教授杰夫瑞·普勒姆(Geoffrey Pullum)在评论这个结果时写道:“我必须承认,我从来没想过会看到这一天。在20世纪80年代,我曾认为完全自动化的连接语音识别(听取连接的会话语音,准确地写下所说的话)对机器来说太难了……而语音工程师已经实现了它,甚至无须依赖任何语法分析[10]:它纯粹是关于工程的,辅以基于海量原始数据的统计建模……我不仅没想到会看到这结果,而且还会自信地否定它。”
1700550272
1700550273 传奇电脑科学家弗雷德里克·杰林克(Frederick Jelinek)的评论捕捉到了人工智能领域从基于规则的方法向统计方法大范围转型背后的原因。杰林克在20世纪80年代中期观察到:“每当我辞退一名语言学家,语音识别器的表现就随之改善。”到2015年左右,处理语音翻译相关问题最为成功的团队里面没有语言学家,而他们的研究结果震惊了全世界。我们坚信,更多类似的惊喜即将出现。
1700550274
1700550275 我们同意赛富时首席执行官、技术行业先驱马克·贝尼奥夫(Marc Benioff)的观点,即我们正在进入他所说的“人工智能为先的世界”。像我们一样,他看到了取代HiPPO人士决策、让事情做得更好的无数机会。他写道:“许多企业仍然根据本能而不是信息做出重要决策……这将在未来几年内发生变化,因为人工智能变得越来越普遍,它们可能使每家公司和每个员工更聪明、更快、更高效。”几年前,这样的预测听起来像天方夜谭,现在它却像一个没有风险的赌注。
1700550276
1700550277 本章总结
[ 上一页 ]  [ :1.700550228e+09 ]  [ 下一页 ]