1704609980
人工智能:改变世界,重建未来 第二章 以自主学习的方式创建新的人工智能
1704609981
1704609982
2014年,在谷歌旗下一家名为“DeepMind”的人工智能公司的办公室里,一台计算机通过玩一款名为《打砖块》(Breakout)的老雅达利(Atari)2600电子游戏消磨时间。该款游戏是两个年轻人在20世纪70年代初设计的,他们就是苹果公司的创始人史蒂夫·乔布斯和史蒂夫·沃兹尼亚克。《打砖块》实际上是乒乓球游戏《乒乓》(Pong)的一个变体。不同之处在于,不是在屏幕上将球挥向另一位玩家,而是对着砖墙击球,将砖块击碎。这款游戏的目标是摧毁所有砖块。
1704609983
1704609984
正如我们在上一章中提到的,人工智能玩电子游戏并没有什么稀奇的。艾伦·图灵早在1947年就开发出了首款象棋程序,尽管当时的计算机不能运行这一程序。如今电子游戏的特点是有大量非玩家控制角色,这一编程将简单的规则结合起来产生复杂的行为。这样看来,DeepMind的人工智能玩游戏又有什么特别的呢?
1704609985
1704609986
针对这个问题的回答有两个。一是DeepMind的人工智能会逐渐变得更加成熟。就像见证孩子逐渐长大一样,如果一直盯着计算机看,很难察觉到它的变化。然而,每隔50多次游戏再看一下,效果是十分惊人的。开始的时候,DeepMind的人工智能在《打砖块》游戏中的表现简直糟透了,最简单的击球都做不好,而且它似乎并不清楚状况,就好像是把PS4(索尼第四代游戏主机)手柄交到90岁的老奶奶手里,并希望她立刻知道应该做什么一样。虽然它也会偶尔得分,但即使最乐观的旁观者也只能称之为运气。
1704609987
1704609988
200次游戏后,一切变得大为不同。现在游戏中的球拍能够在屏幕上左右移动:即使不是持续得分,也可谓能够轻松得分。再经过数百次游戏,游戏中的人工智简直如同《星球大战4:新希望》结束时的天行者卢克(Luke Skywalker)或《黑客帝国》中的尼奥(Neo)一样,懒散地击球,毫不费力。所有无关的动作都消失了,而且它产生了清晰的策略。
1704609989
1704609990
令DeepMind的人工智能具有重要意义的另一个原因是,它不需要进行大规模训练。传统人工智能的核心原则是必须将规则预先载入系统,这就像是老师在学生参加考试前会依次教他们问题的答案一样。DeepMind的人工智能与众不同之处在于,它能够自主学习,甚至无须告诉它应该怎样做。它所需要接入的就是构成《打砖块》游戏每一帧的30 000个像素点和屏幕上的选手得分。其他需要做的事,就是给它输入得分最大化的指令。之后,人工智能就可以随着游戏的进展获得游戏“规则”,然后逐渐形成能够改善其表现的策略。
1704609991
1704609992
DeepMind的人工智能可以玩的游戏并不只有《打砖块》。它最早玩的游戏是《太空入侵者》(Space Invaders),在掌握极少信息的情况下还学会了其他48个游戏,包括拳击模拟器、武术游戏甚至是3D(三维)赛车游戏。然而,要想突破电子游戏的“微型世界”还有很长的路要走。但这仍是一项惊人的成就,为人工智能的下一步发展指明了方向。下一步发展是什么?按照DeepMind的宗旨,下一步就是“解决人工智能”。
1704609993
1704609994
1704609995
1704609996
1704609998
人工智能:改变世界,重建未来 自主学习的重要性
1704609999
1704610000
人类的与众不同之处就在于能够学习,这也一直是传统人工智能一直努力要实现的。第一章中描述的系统只有在能够遵从规则时进行学习,这些知识是从“知识工程师”的知识中提炼并编入系统架构的。它是对知识自上而下的一种想象,并暗示一个假设,即机器不能自动学习知识。相反,必须将知识进行编程,而且一次编一条。这一点在很多情况下都能够很好地实现,进而在可接受的水平上完成有限的任务。随着解决方案的增多,问题也开始显现。像官僚机构一样,它们开始变得庞大、笨拙、缓慢而且昂贵。
1704610001
1704610002
这提出了一个显而易见的问题。华盛顿大学计算机科学教授普德罗·多明戈斯(Pedro Domingos)指出:“如果机器人掌握了人类除学习以外的所有能力,人类很快就会抛弃它。”但是从一开始就存在一种与人工智能的发展并行的观点,这一观点现在正触发该领域的诸多进展。该人工智能学派不是将思维概念化,而是源于在电脑内部建立大脑模型。该学派不相信逻辑推理是获取真理的最佳(可能是唯一的)途径,而是采用基于观察和实验的实证研究法。这类人工智能并非知识工程师的作品,而是属于名为“机器学习者”的计算机科学家领域。
1704610003
1704610004
这一流派的人工智能由统计学家、神经科学家和理论物理学家开创的概率模型主导,大部分基于所谓的“神经网络”(或者计算术语中所说的“神经网”)来运行,该网络的功能与人脑近似。信息在人脑中以神经元电子放电模式存在。人脑中约有1 000亿个神经元,大约和银河系中的星星一样多。记忆是通过加强不同神经元共同放电而形成的:这一过程被称作“长时程增强”。尽管我们尚须建立一个与人脑一样复杂的神经网络(下一章将详细介绍),但人工神经网络为创造记忆和学习借用了人脑的机制。人脑与神经网络最基本的不同在于,人脑中的长时程增强是一个生物化学过程,而在神经网络中,学习是通过修改其自身代码,以在复杂或不明朗的情况下,找到输入和输出之间或者原因和结果之间的联系而发生的。
1704610005
1704610006
虽然神经网络今天在人工智能领域具有重要地位,但在过去许多年里,它都是被忽视的;它被视作真正人工智能的“异父兄弟”。正如20世纪80年代进入这一领域的知名研究人员戴维·艾克利(David Ackley)所说:“我们接触到神经网络时,人们并未将其视作人工智能。于是,我们被人工智能拒之门外。当时,人们认为人工智能是与符号相关的。它所涉及的是生产系统、专家系统等。进入卡内基–梅隆大学读研究生时,我已经十分厌倦与传统的符号化的计算机相关的事物……我似乎对推理的关注过多,而对判断的关注太少。”
1704610007
1704610008
艾克利影响了一代人工智能研究者,他们几乎使统计工具替代了主流意识中的传统人工智能。这样一来,神经网络就实现了以前的研究人员做梦都想实现的东西:建造能够学习如何玩电子游戏、理解语言、识别相片中的人脸或开车比人类更安全的机器。
1704610009
1704610010
我们在本章中将介绍一些这样的应用。但是在此之前,我们必须回到过去,去认识一个名叫圣地亚哥·拉蒙·卡哈尔(Santiago Ramóny Cajal)的人。
1704610011
1704610012
1704610013
1704610014
1704610016
人工智能:改变世界,重建未来 神经科学之父
1704610017
1704610018
圣地亚哥·拉蒙·卡哈尔是19世纪西班牙病理学家,被称作现代神经科学之父。拉蒙·卡哈尔首次对人类大脑进行了细致的检查。1887年拉蒙·卡哈尔在巴塞罗那大学工作,他发现重铬酸钾和硝酸银可以将神经元染成深色,而周围的细胞还都能够保持透明。后来他回忆道,“染色后的神经细胞连最精细的分枝都变成了棕黑色,在透明的黄色背景映衬下显示出了无可比拟的清晰度,就像用墨汁画的素描一样清晰”。这项神经细胞染色技术意味着拉蒙·卡哈尔能够就人脑展开大量的研究,在过去使用最先进的显微镜是无论如何都做不到这一点的。这样一来,他首次证明了神经元是构建中枢神经系统的基础。
1704610019
1704610020
1943年,拉蒙·卡哈尔去世9年后,两位人工智能研究人员在一篇很有影响力的论文中创建了首个正式的神经元模型,尽管文章的标题《神经活动内在概念的逻辑演算》稍显呆板。
1704610021
1704610022
两位研究人员麦卡洛克(McCulloch)和皮茨(Pitts)组成了一个不同寻常的组合。沃伦·麦卡洛克1898年出生在一个律师、工程师、医生和神学家组成的家庭。他在当时被称为“美国帽子之都”的新泽西州奥兰治长大。麦卡洛克起初打算从政,但后来改变了主意,去耶鲁大学学习了哲学和心理学,并对神经生理学,也就是神经系统的研究产生了浓厚的兴趣。
1704610023
1704610024
皮茨比麦卡洛克小25岁,1923年出生在一个工人阶级家庭,这样的家庭似乎不太可能培养出神童。13岁时,皮茨为了躲避父亲的虐待离家出走,露宿街头。一天,他为了躲避一群地痞流氓的追赶躲进了图书馆。据说,皮茨在接下来的一周都泡在图书馆里,读完了三卷《数学原理》的数学教材。读完以后,皮茨决定给该书的作者之一伯特兰·罗素(Bertrand Russell)写信,指出他认为第一卷中存在的根本错误。这封信给罗素留下了深刻的印象,他甚至邀请皮茨到英国剑桥大学学习,而皮茨却没有接受邀请。皮茨在不到20岁时就被苏联数学物理学家尼古拉斯·拉舍夫斯基(Nicolas Rashevsky)的著作深深吸引,拉舍夫斯基的著作主要涉及数学生物物理学领域。正是凭借着这种能力,沃尔特·皮茨遇到了沃伦·麦卡洛克,并最终开始与其共事。
1704610025
1704610026
麦卡洛克和皮茨共同提出了针对机器内部复制的功能神经元的简化模型。他们在1943年发表的论文中称,从根本上来讲,神经元是一个“逻辑单元”。他们还指出,由这类单元构成的网络几乎能够完成所有的计算操作。
1704610027
1704610028
[
上一页 ]
[ :1.704609979e+09 ]
[
下一页 ]