1700676830
尽管这些意想不到的结果令人惊叹,但仅仅因为程序产生了与脑产生的行为相似的行为,并不能得出这两个系统在结构或功能上是相同的这样的结论。正如伊芙·马德尔的研究表明的那样,许多不同的结构都能产生相同的输出结果。至于马尔提出的人工和自然过程可能使用了相同算法的猜想,过去式学习程序并非如此,因此这个程序也就无法帮助我们理解儿童是如何学习语言的。
1700676831
1700676832
在最近的一项研究中,研究者对动物和深度学习网络识别视觉物体的方式做了比较,证实了许多生物学家持有的观点。[45] 虽然机器、猴子和人都能识别狗、熊等动物的照片,但计算机程序所犯的错误与猴子和人所犯的错误大不相同,这表明机器和动物处理图像的方式是不同的。此外,对程序加以调整并不能改善这个问题,这表明机器和动物的图像处理过程中存在一些根本性的差异。
1700676833
1700676834
2015年,整个职业生涯都在研究这些东西的加里·马库斯(Gary Marcus)表达了一种微妙的观点:“作为研究心智和脑的模型,神经网络的地位仍然很边缘,在研究低层次的感知方面或许有些用,但在解释更复杂、更高层次的认知方面,其作用就很有限了。”[46] 的确,尽管人工智能领域的大多数研究者都从生物学中获得了灵感或遇到了挑战,但他们创造的这些模型中仅有少数几例有助于阐释生物学过程。[47] 学习领域中有一个这样的例子。许多最高效的机器学习程序之所以表现优异,是因为这些程序使用了所谓的“时序差分算法”(这种算法利用了连续预测值之间精准度的差异),最近在围棋对弈中战胜人类的那个程序就使用了这种算法。[48] 2003年的一项研究发现,在人学习的过程中,产生多巴胺的神经元的活动与时序差分模型所预测的完全一致,这为自然学习中也存在这类过程的观点提供了有力的证据。[49] 考虑到时序差分模型可以追溯到对动物学习过程的研究,这样的结果或许并不算让人惊讶。
1700676835
1700676836
一个更好的例子(尽管没有得到充分利用)发生在2013年。哥伦比亚大学理查德·阿克塞尔(Richard Axel)[50] 实验室的苏菲·卡隆(Sophie Caron)和瓦妮莎·鲁塔(Vanessa Ruta)的工作发现,果蝇的嗅觉处理网络的结构本质上遵循神经网络的三级结构,其中的“隐藏层”对应于蘑菇体(mushroom body)——昆虫用来学习气味的脑结构。[51] 他们的研究还发现,不同果蝇个体的蘑菇体的组织方式存在差异,这使蘑菇体看起来像是一个随机组织的结构。阿克塞尔的团队与他们的理论神经科学家同事拉里·阿博特(Larry Abbott)合作,提出这种随机结构可能为果蝇的学习能力提供了基础。阿博特和阿克塞尔随后与珍妮莉亚研究园区的研究人员合作,对此做了进一步的探索。[52] 这些研究表明,每只果蝇蘑菇体中细胞的连接方式都不尽相同,这种随机的组织方式再加上反馈环路(本质上与反向传播相同,但包含一系列细胞)显然使果蝇能够学习气味的重要性,并根据具体情况调整其行为输出。离开理论科学家利用神经网络开展的这些工作,对果蝇脑(或许是人类目前了解最多的动物脑)的这些认识是不可能出现的。然而这是否真的就是果蝇脑的工作方式,还有待观察。[53]
1700676837
1700676838
动物可以非常快地进行学习,有时仅基于单个例子就能学会某个任务,而程序通常需要较长的时间并使用大的训练集,这种差异或许能为如何提高人工智能的能力提供思路。[54] 动物之所以能做出这样了不起的事,是因为它们的神经系统已经进化出对某些特定刺激做出反应的能力——按照康德的观点,这种关系是先验的,脑已经做好了建立某些连接而非另外一些连接的准备。例如,如果一只大鼠在吃了一种新奇的食物后感到不舒服,那么从这一次经历中它就会学会在此后避开这种食物。[55] 但如果你把电击与这种食物,或者把恶心的感觉与新奇的声音关联起来,那么这种单次的经历就不会使大鼠回避这种食物。很明显,由于进化的原因,这种先验的关系只存在于味道与恶心的感觉之间。将这些预先存在的结构添加到人工网络模型中有可能会进一步提高这些模型的性能。
1700676839
1700676840
虽然有这些研究结果,但总的来说,这些惊人的计算机程序并不能产生明确的生物学假说,因此它们并不能阐明真正的脑是如何工作的。在把神经网络程序作为生物学研究指针这一点上,仍然面临的部分问题是,我们还不清楚程序是如何得出这些结果的。这不仅让像我这样的人感到迷惑,也让研究人员感到茫然。事实上,情况一直如此:1987年,“网语”的作者承认,尽管他们能够“理解一些隐藏单元的功能,但在不同的网络中识别具有相同功能的单元是不可能的”。今天的程序不仅复杂得多,甚至更难分解。[56]
1700676841
1700676842
2017年12月,谷歌的人工智能研究者阿里·拉希米(Ali Rahimi)指出,“机器学习已经变成了炼金术”,因为搞不清楚算法具体在做什么。[57] 另一位研究者甚至声称这个领域“充斥着货物崇拜式的操作”[58] ,依赖于“民间传说和魔法咒语”。2019年,在接受《连线》杂志有关神经网络的采访时,杰弗里·辛顿欣然承认“我们真的不知道它们是如何工作的”。[59] 对任何期待神经网络能为脑的工作机制提供理论解释的神经科学家来说,这都是一个警示。许多计算机科学家也意识到,他们同样缺乏一个理论来解释他们那复杂的系统。
1700676843
1700676844
1700676845
1700676846
1700676847
虽然PDP方法取得了突破性的进展,一些批评者仍然很快就开始怀疑它对理解生物学问题有多大用处。1989年,克里克在《自然》杂志上发表了一篇四页的文章,标题带着他惯常的贵族腔调:《有关神经网络的近期佳讯》(The Recent Excitement About Neural Networks)。[60] 1977年,克里克搬到加利福尼亚的索尔克研究所(Salk Institute)从事神经科学研究,成为那里的PDP研究组成员。但很快,他恼火地发现这些程序在生物学上存在一些根本的缺陷,特别是它们缺乏解剖学和生理学上的准确性。尤其让他恼火的是这些程序对反向传播的依赖,他写道:“这几乎不可能发生在真实的脑中。”[61][62]
1700676848
1700676849
克里克的批评涉及的不仅仅是生物学上的不准确性。他还借机抨击了一些研究者的动机,说他怀疑“大多数建模研究者心中都隐藏着一个受挫的数学家,正在蠢蠢欲动”,而且他们的目标是“把一种智力上的体面用到低级趣味的事业上”。克里克随后强调了计算机科学和生物学之间的差距:
1700676850
1700676851
如何构建一台能工作的机器(比如一台高度并行的计算机),这是一个工程问题。工程通常以科学为基础,但其目标是不同的。一件成功的工程作品是一台能做有用之事的机器。另一方面,理解脑是一个科学问题。脑是我们天生就有的,是长期进化的产物。我们并不想知道脑可能是如何工作的,我们想知道它实际上是如何工作的。[63]
1700676852
1700676853
对克里克来说,脑的进化历程意味着它是通过一系列步骤构建起来的,每一步都不是完美的,而只是勉强可用而已,用他的话说,“只要能用,什么都行”。脑并不是设计出来的,因此我们不能确定它是否会体现“深层的普遍原理”。他指出,“脑可能更喜欢耍一系列巧妙的花招来实现它的目标”,我们需要做的不是寻找可能并不存在的逻辑原理,而是“对这个小玩意的仔细探查”。克里克进一步阐述说,科学家应该“深入观察脑,以获得新的想法和测试现有的想法”。4年后,正是这个大的方向促使克里克提出了发展脑连接图谱的倡议。
1700676854
1700676855
不用说,大多数对用计算方法研究行为感兴趣的人都忽略了克里克的建议。一些研究者确实用了一些方法让他们的模型更加贴近现实,例如引入信号分子(如一氧化氮)的扩散效应(这些程序被称为“气网”),或者证明程序的有效执行并不一定需要严格对称的前馈和反馈效应。[64] 但大多数人依旧埋头于自己的工作,创造出越来越让人印象深刻的软件,并且对把自己的工作与脑的解剖学或生理学联系起来毫无兴趣,这一点也不令人意外。[65]
1700676856
1700676857
在克里克表达怨言几年后,一些研究者采用了不同的计算方法。他们没有对一小部分神经元进行建模,也不是在不考虑结构的情况下尝试复制脑产生的行为,而是开始在计算机上模拟神经系统,就像1956年IBM的研究人员所做的那样,但这次的模拟具有高水平的解剖学精确性。
1700676858
1700676859
1994年,吉姆·鲍尔(Jim Bower)和大卫·比曼(David Beeman)出版了一本有关神经网络模拟器编程的书。这本书既是一份宣言,也是一部教程,并且很机灵地将模拟器命名为“创世记”(GENESIS,缩写自GEneral NEural SImulation System)。[66] 这本书顺理成章地被命名为《创世记之书》(The Book of GENESIS ),其章节的标题是哥特手写体,书中附有能在家用电脑上运行系统的软盘。这个程序使研究人员能够模拟区室化的神经元,每个区室上都有突触和不同密度的离子通道,这些离子通道的运作都遵循霍奇金和赫胥黎发现的规律(这一发现本身就涉及建模),连突触上的突触电位都符合现实中的情况。根据研究人员对神经解剖学的兴趣,这些虚拟神经元可以在现实网络中被连接到一起。[67]
1700676860
1700676861
这种相对温和的模拟环境后来成为有史以来最昂贵的科学计划之一——“人脑计划”(Human Brain Project)的先行者。这个为期10年的宏大计划于2013年启动,由欧盟委员会出资,资助总额超过10亿欧元。整个计划的参与者来自22个国家的80个研究机构,总共有150个研究小组,并将培养5000名博士生。计划最初的目标非常不现实,宣称如果计算机的功能足够强大,到2020年时将有可能“模拟整个人脑,并且精细水平达到细胞级”,暗示唯一的限制因素是技术问题。[68] 或许是出于这个原因,整个计划的一个主要工作是致力于开发新的计算方法和数据库管理系统。[69] 尽管获得了前所未有的资金支持,但这个计划的主张过于雄心勃勃,并且许多计划产出与生物学的相关性不明确,这导致许多欧洲的神经科学家拒绝加入。其他一些研究者则从哲学角度反对这个项目,他们对从大规模模拟中是否能获得对脑的深入理解持怀疑态度(“认知不透明”是一个被反复提及的术语)。[70]
1700676862
1700676863
在项目启动后不久,更深层的问题出现了:虽然认知和神经生物学的工作对理解脑可能至关重要,但整个计划对这些领域表现得不够重视,而是更重视计算相关的领域。[71] 超过750名科学家随后给委员会发出了一封联名公开信,《自然》杂志也发表了一篇题为《“人脑计划”中的脑在哪里?》的观点文章。[72] 虽然项目的牵头人亨利·马克拉姆(Henry Markram)后来被撤职,各种管理问题也得到了解决,但许多神经科学家仍然认为,无论这个项目在计算机科学方面将会有何种产出,这项耗资巨大的项目将不会对理解脑的工作机制提供什么深刻的见解。
1700676864
1700676865
2015年,马克拉姆领导的另一个模拟项目——蓝脑计划(Blue Brain Project)的第一份重要研究成果以三篇长篇论文的形式面世。[73] 这些论文的数据来自一个长2毫米、直径0.5毫米的圆柱形脑组织,这块组织取自大鼠运动皮层控制后肢运动的区域,只是大鼠脑的一个微小分区。研究确定了大约1000个神经元的三维结构,并以这些数据为基础构建了一个这个脑区的模型。模型包含大约31000个虚拟神经元,分为207种类型,由大约3700万个假想的突触连接起来(这块大鼠脑组织中突触的真实数量事实上要远超于此)。模型中虚拟神经元的活动基于的是3000多个细胞的真实数据。作者承认,这个模型“省略了微环路结构和功能的许多重要细节,如间隙连接、受体、胶质细胞、血管系统、神经调制、可塑性和内稳态”。[74] 缺失了如此多的要素,再加上模型只用到了大鼠脑的极小一部分,就不难理解为什么许多神经科学家会认为这种做法完全是浪费钱,并且对媒体对此类项目的夸大报道感到愤怒了。
1700676866
1700676867
尽管刻意缺失了这么多关键特性,这个系统的表现仍然与一组真正的神经元大致相同,能表现出同步的活动,并且明显能在不同状态间切换。研究团队没有在这个微小的空间中模拟每一个神经元和突触,也没有模拟任何缺失的细胞和功能,但模型没有运行不畅和崩溃,其运行方式基本上与一个真正的脑区中观察到的运行方式相同。这些研究并没有什么惊天动地的发现,但可以这么说,它们的存在,以及模型和数据已经可以被广泛使用,标志着我们向前迈出的一步。
1700676868
1700676869
马克拉姆继续坚定地宣称,不仅这个项目是站得住脚的,而且他所谓的“模拟神经科学”(simulation neuroscience)在我们理解脑的历史上占有决定性的地位。[75] 然而科学记者埃德·扬(Ed Yong)在2019年调查了10年间受到马克拉姆的研究启迪的工作,得出的结论很让人丧气:“在我采访的人中,很难有人说得出哪怕一项‘人脑计划’在过去10年中做出的重大贡献,这或许能说明一些问题。”[76]
1700676870
1700676871
“人脑计划”坚决采用自下而上的方法。它没有关于脑如何工作的全面理论。其思想是,对脑的一部分进行模拟,通过去除模拟脑中的组件、改变它们的行为等方式,观察整个系统会受到怎样的影响,以此来研究脑的功能,而关于脑如何工作的理论(如果能有的话)将在此后涌现。加拿大滑铁卢大学的克里斯·埃利亚史密斯(Chris Eliasmith)领导的研究小组则采取了一种截然不同的自上而下的方法。2012年,他们发布了“Spaun”(“Semantic Pointer Architecture Unified Network”的首字母缩写,意思是“语义指针架构统一网络”),这是一个包含250万个神经元的模型,连接在一条机械臂上。这并不是一个泛泛的模拟,而是为了完成一个非常具体的任务设计的:研究人员向Spaun展示了一系列的图片,并要求Spaun画出其中一张。因此,这项任务结合了字符识别、记忆以及一个棘手的问题——控制机械臂复制出需要画的那些字符。结果非常惊人,Spaun不仅表现出了高度准确的识别能力(包括识别手写笔迹的能力),还有准确的复制能力,复制水平已经达到儿童的水平。[77]
1700676872
1700676873
但这项研究无法让所有人满意。马克拉姆对Spaun就不以为然,轻描淡写地说:“这不是一个脑模型。”[78] 或许确实不是,但要理解脑中正在发生的事情,也许我们并不一定需要为每个神经元建模。许多没有参与大型建模项目的研究者都持这种观点,神经生物学家亚历山大·博斯特(Alexander Borst)就是其中之一,他曾说:“我仍然认为要了解脑在做什么,没有必要同时模拟一百万个神经元。我相信我们可以把规模缩减到少量神经元,并从中获得一些发现。”
1700676874
1700676875
1700676876
1700676877
1700676878
在过去的20年间,许多神经科学家,尤其是那些从事认知和理论神经科学研究的科学家,越来越相信脑是按照贝叶斯逻辑(Bayesian logic)运行的。[79] 托马斯·贝叶斯(Thomas Bayes)是18世纪的英国牧师和统计学家,他研究了基于既有知识和假设的预期的概率问题。英国心理学家理查德·格雷戈里(Richard Gregory)是这种方法的早期倡导者,他在1980年用了视错觉的例子来支持自己的观点。[80] 这种观点与赫尔姆霍兹关于环境事件的脑发育假说存在关联,并且与心理过程有一种直觉性的联系。比如在权衡选择时,我们经常关注强有力的证据而忽略较弱的证据,这本质上是一个贝叶斯过程。[81]
1700676879
[
上一页 ]
[ :1.70067683e+09 ]
[
下一页 ]