1701550490
1701550491
一个命题不仅可以是关于一个个体的,它自身必须被视为一种个体,这就引发了另一个问题。联结浆糊的力量来自单个一组单位中添加的模式。不幸的是,这可能产生怪异的四不像或是建一个两头都落空的网络。对于联结浆糊,这是无处不在的怪物的一部分,被称为干扰或串扰。
1701550492
1701550493
这有两个例子。心理学家尼尔·科罕(Neal Cohen)和迈克尔·迈克劳斯基(Michael McCloskey)训练一个网络学习两个数的加法。他们起初训练它把“1”加到其他数上:当输入“1”和“3”时,网络学会输出“4”,诸如此类。然后他们训练它把“2”加到所有其他数上。不幸的是,这个加2的问题将联结权重提升到加2为最优的值,因为网络没有富余的硬件来设定如何加1的知识,它竟将如何加1忘掉了!这种效应被称为“灾难性遗忘”,因为它不像日常生活的轻度遗忘。另一个例子是麦克莱兰德和他的同事阿兰·川本(Alan Kawamoto)设计的网络,将含义分配给语义含混的句子。例如,“A bat broke the window”的意思可以是一根棒球棒(bat)被扔到窗户上,也可以是一只长翅膀的哺乳动物(蝙蝠:bat)撞到窗户上。而下面这个解释则是人类得不出来的:一个长翅膀的哺乳动物用一根棒球棒打碎了窗户!
1701550494
1701550495
正如任何其他工具一样,令联结浆糊对某些事有效的特点,也令它对另一些事无效。网络概括的能力来自于它密集的交互联结性和它输入的叠加重合。但如果你是一个单位,有几千个其他单位在你耳边聒噪,还被一浪接一浪的输入所蹂躏,这并不总是一件乐事。经常是不同的信息组块被分开打包和存储,而不是随意混在一起。一种这样做的方式是给每一个命题分配它自己的存储槽和地址——这再显示了并不是计算机设计的所有方面都可以被草率归结为硅的好奇心。毕竟设计计算机不是来用作室内加热器,设计它是为了以一种对人类使用者有意义的方式来处理信息。
1701550496
1701550497
心理学家戴维·舍莉(David Sherry)和丹·夏克特(Dan Schacter)将这种推理推得更远。他们注意到,对于内存记忆系统不同的工程设计要求往往是目标交叉的。他们辩称,作为回应,自然选择给了有机体专门化的记忆系统。每个系统都有一个优化的计算架构专门适合于动物心智必须完成的一个任务的要求。例如,贮藏种子以备收成欠佳日子里食用的鸟类进化出了一种对于隐藏地点的大容量记忆(以星鸦为例,它可记忆10000个地方)。雄鸟歌唱吸引雌鸟,或者恫吓其他雄鸟的鸟类进化出对于歌声的大容量记忆(以夜莺为例,它可记忆200种歌声)。对于储藏地和歌声的记忆是位于不同的脑部结构,并且有着不同的神经元连接模式。我们人类对于记忆系统同时有着两种非常不同的要求。我们要记住谁在什么时间、什么地点、为什么对谁做了什么这种独特场景,这需要在每个场景都标记上时间、日期和一个序列号。但我们还必须推断出关于人们如何工作和世界如何运转的一般性知识。舍莉和夏克特提出的观点是:自然对每种要求分别赋予了我们一种记忆系统:一种“情景式”或自传体式记忆,另一种是“语义式”或一般性知识的记忆,心理学家恩德尔·托尔文(Endel Tulving)最早提出了这种区分。
1701550498
1701550499
思维成倍增加到真正的天文数字的把戏不是将概念插槽分配给三四个角色,而是一种被称为递归的心智能力。为每个角色安排固定一组单位是不够的。我们人类可以将一整个命题放到一个更大的命题中,赋予它一个角色。然后我们可以将这个更大的命题嵌套到一个还要大的命题中,这样创造一种命题中有命题的层级式树形结构。不仅这个婴儿吃毛虫,而且父亲看见这个婴儿吃毛虫,我想知道父亲是否看见这个婴儿吃毛虫,父亲知道我想知道他是否看见这个婴儿吃毛虫,以及我能猜到父亲知道我想知道他是否看见这个婴儿吃毛虫,等等。正如给一个数字加1的能力是一种产生一组无限多的数的能力,将一个命题嵌套到另一个命题中的能力,也是一种增加了无限多思维的能力。
1701550500
1701550501
为了在图2-13所展示的网络中完成命题之中嵌套命题,可以在图的顶部增加一个新联结层,将整个命题的储存单位联结到一个更大命题的角色插槽中;这个角色可以是像“观察的事件”一样。如果我们继续添加足够的层级,我们就可以通过在联结浆糊中侵蚀全部树形结构而容纳整个成倍增加的嵌套式命题。但这种方法太笨拙,而且会引起疑惑。对于每一种递归式结构,都有一种不同的物理连接网络:一个网络供思考一个命题的一个人;另一个网络是为思考一个关于一个思考一个命题的人的命题的一个人,第三个网络是供一个人与另一个人进行关于某个人的命题的交流,等等。
1701550502
1701550503
在计算机科学和心理语言学中,采用了一种更为强大和灵活的机制。每个简单结构(一个人、一种行为、一个命题,等等)都在长期记忆中得到一次表征,处理器的注意在一个结构到另一个结构之间不断穿梭转移,将转移的路线记录在短期记忆中,从而将命题编织在一起。这种被称为递归式转换网络的动态处理器,特别适合于句子理解,我们是一次听或者读一个单词,而不是一次吐纳一个整句。我们似乎也是在一点一点咀嚼深思我们的复杂思维,而不是囫囵咽下或喷出,这说明,心智配备的递归式命题计算研究机不仅仅是为了句子,而且是为了思维。心理学家迈克尔·乔丹(Michael Jordan)和杰夫·艾尔曼(Jeff Elman)构建了一些网络,这些网络的输出单位发出的联结回送到一组短期记忆单位,触发了新一轮激活流。这种回送设计使我们隐约看到,迭代信息处理在神经网络中是如何执行的,但它还不足以解释或汇编结构性命题。最近,有研究者尝试将一个回送式网络与一个命题式网络组合在一起,从联结浆糊的碎片中完成一种递归式转换网络。这些尝试说明,除非神经网络中特别装配了一个递归式处理器,否则将无法处理我们的递归式思维。
1701550504
1701550505
心智还具有的另一项认知本领很难从联结浆糊中提取出来,因而也很难用关联论来解释。神经网络轻易地解决了模糊逻辑的问题,即任何东西都是在某些程度上的某种东西。确切地说,许多常识性的概念在其边界处都很模糊,并没有清晰的定义。哲学家路德维希·维特格斯坦举了“a game”(游戏、比赛)的例子,其典型例子彼此并没什么共同之处(包括拼图、速度轮滑、冰壶、角色扮演游戏、斗鸡,等等)。我在前面也曾给出了另外两个例子,“单身汉”和“蔬菜”。模糊类别的成员缺少一个单一确定的特点;它们的许多特点都有所重叠,很像一个家庭中的成员或是绳子的每一股,每一股都没有延续到整个绳子的长度。漫画《布卢姆县》中,企鹅奥普斯患暂时性失忆,当被告知它是一只鸟时,它不同意。它说,鸟的身材苗条,符合空气动力学;而它不是。鸟能飞,它不能。鸟能歌唱,它唱的《昨天》令听众哄堂大笑。奥普斯怀疑它实际上是驼鹿布尔温克。所以即使是“鸟”这样的概念似乎也没有围绕必要和充分条件来组织,而是根据原型成员来界定的。如果你在字典里查“鸟”,例图显示的不是一只企鹅,而是小鸟乔伊——一只典型的麻雀。
1701550506
1701550507
认知心理学的实验显示,人们对于鸟、其他动物、蔬菜和工具都有刻板印象。人们对一种刻板印象达成共识,把它反映到一个类别中的所有成员上,比较对于那些不符规范的成员更为迅速地识别出这种刻板印象,甚至当见到的实际只是相似的例子时也宣称其为那种刻板印象。这种反应取决于一个成员与其类别中其他成员之间相同特征的数量:像鸟的特征越多,就越属于鸟类。从一个类别中呈现例子的自动协关器其实在做同样的事情,因为它是在计算特征之间的相关性。所以有理由相信,人的一部分记忆是由一些像自动协关器的东西所连接的。
1701550508
1701550509
但心智一定还有比这更多的东西。人们并不总是模糊的。我们笑话奥普斯是因为我们的一部分知道它确实是一只鸟。我们或许同意奶奶的原型是这样的——好心的、灰白头发的、分发蓝莓松饼或鸡汤的七八十岁的老人(依我们所谈论的各人的刻板印象而定)——但同时我们完全明白蒂娜·特纳和伊丽莎白·泰勒也是奶奶(实际上泰勒还是个犹太奶奶)。说到单身汉,许多人——诸如移民官员、太平绅士,还有保健官僚们——因其对于谁属于某个类别毫不含糊而臭名昭著;众所周知,很多事情因一页纸而有天壤之别。毫不含糊的思维例子随处可见。法官可以根据技术理由而释放一个显然有罪的嫌疑人。酒吧服务员拒绝向一个能够对自己行为负责的人提供啤酒,因其尚未过21岁生日。我们开玩笑说,你不能有点儿怀孕或是有点儿结婚;加拿大的一个调查报告称,已婚女性每周做爱1.57次后,卡通画家泰瑞·莫舍画了一个女人坐在床上,挨着她昏睡的丈夫嘟囔:“唉,这算0.57次。”
1701550510
1701550511
事实上,模糊版和清晰版的相同类别可以相安无事地共处于一个脑中。心理学家莎朗·阿姆斯特朗(Sharon Armstrong)、亨利·格雷特曼(Henry Gleitman)和丽拉·格雷特曼(Lila Gleitman)在给大学学生做模糊类别的标准测试时,问他们关于像“奇数”和“女性”这样有明确定义的类别。被试们愉快地接受了一些愚蠢的陈述,比如,13是比23更好的一个奇数的例子,以及母亲是比戏剧女演员更好的一个女性的例子。过了一会儿,被试们却又断言,一个数要么是奇数要么是偶数,一个人要么是男人要么是女人,没有中间地带。
1701550512
1701550513
人们用两种方式来思维。世界上的东西总是倾向于扎堆儿,人们因此不假思索地吸取了各个特征的相关性,从而形成了模糊的刻板印象。但人们也能创造系统规则——直觉理论——根据适用的规则来界定类别,并依据规则一视同仁地对待类别中的所有成员。所有的文化都有正式的亲缘规则系统,这种规则系统非常精确,甚至往往能够证明其中的定理。我们自己的亲缘系统为我们给出了清晰版本的“奶奶”或“姥姥”:父母一方的母亲,让松饼见鬼去吧。法律、算术、大众科学以及社会惯例(用其生命阶段的仪式清晰地将成人与孩童,丈夫与单身汉区分开来)是其他的一些规则系统,世界各地的人们用这些规则系统做出评断。一门语言中的语法是另一种规则系统。
1701550514
1701550515
规则系统使我们从单纯的相似性中升华出来,根据解释来得出结论。欣顿、鲁梅尔哈特和麦克兰德写道:“人们善于归纳新获得的知识。例如,如果你得知黑猩猩喜欢吃洋葱,很可能会提高你对大猩猩喜欢吃洋葱的预测的概率。在一个使用分布式表征的网络中,这种概括归纳是自动的。”他们的夸口其实是休谟言论在20世纪的回响,休谟曾说,人们看到色彩和外形都像面包的一个东西,会指望能从中得到类似的营养。但在任何一个人熟悉的领域,这个假设都会土崩瓦解。当然,爱吃洋葱的大猩猩只是一个刻意的例子,但有趣的是,即使是这么一个简单的例子也低估了我们。我知道一些动物学知识,不过对大猩猩不甚了解,但我绝不会提高我对大猩猩喜欢吃洋葱的预测概率。动物能够被交叉分类。它们可以根据家谱和相似性分作不同的类群,如猩猩类,但也可以根据获取食物的专有特定方式分作不同的种群,如杂食动物、食草动物和肉食动物。知道这个原则令我做出如下推理:黑猩猩是杂食动物,它们吃洋葱不奇怪;毕竟我们也是杂食动物,我们也吃洋葱。但大猩猩是食草动物,它们整天大嚼野生芹菜、蓟和其他植物。食草动物往往对它们赖以为食的植物种类十分挑剔,因为它们的消化系统最适合于化解某些种类植物的毒性而不是其他植物的毒性。一个极端的例子是考拉,它们只吃桉树叶子。所以如果大猩猩不吃辛辣的洋葱,我不会感到奇怪。根据我所想到的不同解释系统,黑猩猩和大猩猩可以同属于非常相似的种类,也可以像人和奶牛一样差之千里。
1701550516
1701550517
在关联论及其联结浆糊的应用中,物体的表征方式(即作为一组特征)自动地委托系统以一种特定的方式来进行概括归纳(除非用专门提供的相反例子来训练它不做这样的归纳)。我所推销的替代方案是,人们可以在心理上对各种物体予以符号化,而那些符号可以指向我们脑袋里配备的多个规则系统。在人工智能中,这项技术被称为基于解释的归纳;关联论者的设计则被称为基于相似性的归纳。我们的多规则系统包含知识的特点包括组成性、量化性、递归性命题,以及汇集这些命题而形成的关于特定范畴经历的模块或直觉理论,这些范畴包括亲缘关系、直觉科学、直觉心理、数字、语言和法律。第5章我们将探讨其中的一些范畴。
1701550518
1701550519
清晰的类别和多个规则系统有什么好处呢?在这个社会性世界中,当讨价还价的双方都指着一个边界模糊类别,一个说某东西在里面,另一个说在外面,这时清晰类别和多个规则系统就可以对此做出评判。人生阶段仪式、法定年龄、证书、许可证以及其他法律文件划出了各方心理上都能明确的清楚界线,这些界线令所有人都知道其他任何人所占据的位置。类似地,全或无规则反对的是步步为营的战术,在这种战术下,人们尽量利用模糊的类别,为自身的利益一次又一次地发起边界争执。
1701550520
1701550521
规则和抽象类别也有助于处理自然界的事务。它们避开相似性,使我们能够深入,探索出事物运行的隐含法则。因为它们在某种意义上是数字性的,它们使得表征更为稳定和精确。如果你从一盘模拟磁带翻录一连串模拟复制品,那么其质量会随着被复制次数的增加而逐渐下降。但如果你制作一连串数字复制品,最后一个与第一个的质量会一样好。与之类似,在推理链中清晰的符号表征,将符号逐一不落地复制到连续的思维中,形成了逻辑学家们所称的一种诡辩法。
1701550522
1701550523
所有的乌鸦都是鸦。
1701550524
1701550525
所有的鸦都是鸟。
1701550526
1701550527
所有的鸟都是动物。
1701550528
1701550529
所有的动物都需要氧气。
1701550530
1701550531
无论经验多么贫乏,诡辩法都使思想者充满信心地得出结论。例如,一个思想者得出结论认为乌鸦需要氧气,即使没有人会真这么做来看看会发生什么。即使他从来没见证过任何一个剥夺动物氧气的实验,而只是听到一位可信赖专家的陈述这个思想者仍会得出这个结论。但如果这个推导中的每一步都是模糊的或者概率性的,或者胡乱堆砌了前一步类别成员们的特征,那么稀泥就越和越乱了。上面这个陈述会像第N代的私贩磁带一样充满噪音、杂乱无章或是像糟糕的传话游戏中的最后一声低语那样难以识别。各个文化中的人们都在进行长链式的推理,无法直接观察这些推理所基于的连接是否真实。哲学家们常常指出,科学就是因为这种能力才成为可能。
1701550532
1701550533
就像许多围绕心智的问题一样,对关联论的争论往往被当作是先天禀赋与后天学习之间的争论。这几乎不可能想清楚。当然,在关联论者的建模中,学习扮演着极其重要的角色。建模者往往在被我前面提到的那些问题所难住,不得不重新考量时,就会利用隐含层网络的能力,学习一组输入和输出,然后将它们概括运用到新的、类似的情况。经过对通用隐含层网络的辛苦培训,人们有时可以令它做到近似正确的事。但英雄式的灌输式培训自身并不能成为联结浆糊的救世主。这不是因为网络天生结构太少和外部环境输入太多,而是因为原始联结浆糊的动力不足,所以网络的构建往往必须用最差的组合:太多的天生结构结合太多的外部环境输入。
1701550534
1701550535
例如,欣顿修改了一个三层网络来计算家庭关系。他本意是想用来展示网络是如何工作的,但其他的关联论者都把它当作是一个真实的心理学理论。输入层有为名字而设的单位,也有为关系而设的单位,比如“科林”和“母亲”。输出层有为与之相关人的名字而设的单位,如“维多利亚”。既然单位和联结都是网络的天生结构,就只有联结权重是习得的了,如果我们确实认为网络回应脑中的一个天生模块,只是为了对谁以一定的方式与一个有名字的人有关系这类问题分别作答的话。这不是一个对一般性亲缘关系进行推理的系统,因为知识被涂抹到了问题层和答案层之间的联结权重上,而不是被储存在能够以不同提取方式获得的数据库中。所以,一旦问题略微变动一下,比如问两个人是什么关系,或者问一个人家庭成员的姓名和关系时,知识就没用了。在这个意义上,模型就有了太多的天生结构,成了为某个特定测验量身定制的了。
1701550536
1701550537
在培训了其模型在一个小规模自制家庭中的关系后,欣顿请大家注意,这个模型能概括归纳出新的几对亲属关系。但仔细研究他的研究结果后,我们发现,这个网络需要对可能的104对中的100对加以学习,才能够概括归纳出剩余的4对。而培训过程中这100对的每一对都需要被注入网络达1500次之多(培训课程共计150000次)!很显然,孩子们学习家庭亲属关系的方式肯定与此大相径庭。这个数字对于关联论者的网络来说比较普通,因为它们并不用规则的方式来获得解决方案,而是需要将绝大多数例子生敲硬塞进网络,并只在例子之间进行插补。每种大体不同的例子都必须列入培训的内容,否则网络就会胡乱插补,就像统计学家们讲述的猎鸭故事一样:一人射得高了一米,第二个射得低了一米,第三个大声喊:“我射中它了!”
1701550538
1701550539
为什么要把联结浆糊放到强光下这么审视呢?当然不是因为我认为神经网络建模不重要——恰恰相反!若没有它,我对于心智如何运作的整个理论体系将像空中楼阁一样摇摇欲坠。也不是因为我认为这种网络建模只是将构建“小幽灵(后台程序)”和数据结构的工作从神经硬件工作中外包了出去。许多关联主义者模型为心智运算的最简单步骤所能取得的成就提供了意外的洞见。但我确实认为关联主义论调过于泛滥了。因为网络被宣传为柔性的、平行的、类推的、生物性的以及连续的,所以它们得到了讨喜的内涵和广泛的拥趸。但神经网络并不创造奇迹,它们不过是在执行一些逻辑和统计运算。选择输入表征、网络数量、每个网络的联线方式,以及数据路径和连接这些路径的控制结构,比起联结浆糊组件的通用能量来说,神经网络更多地解释了怎样令一个系统变得智慧。
[
上一页 ]
[ :1.70155049e+09 ]
[
下一页 ]