打字猴:1.707610379e+09
1707610379 世界因何美妙而优雅地运行 [:1707606731]
1707610380 世界因何美妙而优雅地运行 120HORMESIS IS REDUNDANCY毒物兴奋效应(21)是一种冗余
1707610381
1707610382 Nassim Nicholas Taleb 纳西姆·尼古拉斯·塔勒布
1707610383
1707610384 纽约大学理工学院特聘教授,著有《黑天鹅》(The Black Swan)。
1707610385
1707610386 大 自然是统计学和概率学的大师。大自然作为一种中央风险管理的方法,其遵循着某种基于层层冗余的特定逻辑。大自然构建着额外的备用配件,比如人有两个肾,以及在诸多事物上都给予了额外的能力,比如肺、神经系统、动脉器官等,但如果这些由人类来设计的话,就会倾向于节约与过度优化,并有着与冗余截然相反的属性:杠杆作用;从历史轨迹来看,人类会涉足债务,这就是冗余的反向。如5万美金存放在银行,甚而放在床垫下,这就叫冗余;欠银行5万美金,则是债务。
1707610387
1707610388 在这其中引人注目的是,如今被称为毒物兴奋效应的机制便是冗余的一种形式,其统计上的精细化程度,迄今为止,人类科学都无法匹敌。
1707610389
1707610390 毒物兴奋效应,是指有害物质或紧张性刺激在适当剂量或强度下刺激着生物体,并使生物体更好、更强、更健硕,还要为下一次承受更大的剂量做好准备。这就是我们去健身房、进行间歇性禁食或减少热量摄入,或是对愈发严峻的挑战过度补偿的原因。在20世纪30年代后,毒物兴奋效应失去了科学界的重视和兴趣,其中部分原因在于有些人误认为它与顺势疗法相关。但认为这二者彼此相关并不合理,因为它们二者的机制截然不同。顺势疗法依循的原理与毒物兴奋效应的不同,它利用比如剂量微小、高度稀释的疾病致病原(小到很难被察觉到,因而不会引起毒物兴奋效应)产生疗效从而抵抗疾病。因为没有实证的支撑,时至今日顺势疗法仍属于非传统医学;但毒物兴奋效应,从其效果而言,已经显示出充分的科学证据。
1707610391
1707610392 事实证明,冗余和过度补充的逻辑是相同的,犹如大自然有个简洁、优雅且统一的做事风格一样。比方说,如果我摄入了15毫克的有毒物质,我的身体会变得更为强壮,能够应付20毫克以上的毒物。比如,通过空手道练习或搬运物品让我的骨头增压会让骨头变得更强硬、骨密度更高,可以做好承受更大压力的准备。过度补偿系统必须处于过量模式,才可构建出额外的能力和力量,这是因为我们会预期还会有更糟的结果,所以需要更大、更强壮的力量或承受能力来应对可能的危害信息。这是通过压力来发现可能性的极端形式做出的反应。当然额外的能力或力量本身非常有用,即使在没有危险时也能带来某些益处。冗余是积极而非被动消极地面对人生。
1707610393
1707610394 我们拥有多种多样的制度性风险管理方法。目前的做法是依照过去最坏的情况,我们称其为“压力测试”,并相应地做出调整,却从未想过这样的偏差可能并不足以应对未来发生的真实状况。比如,当前系统会以历史上最差的衰退、最惨烈的战争、历史上最糟糕的利率变动、最糟糕的失业率等为经验教训,为未来最坏的结果做准备。我们当中的许多人都经历过因为压力测试的方法而受挫,而且是严重受挫,因为在测试中,人永远不会想超越过去发生过的事情;甚至在主张应该考虑更糟糕的情况之际,还得面对那种常见的、天真的实证主义式的质疑:“你有证据吗?”
1707610395
1707610396 诚然,这些系统不会在心智中进行递归练习,以此来看到明显的结果,即在过去最糟糕的事件之前并没有同样糟糕的先例,比如说在发生世界大战之前,在欧洲用最糟糕案例来进行评估的人,一定会大惊失色。我把此现象称为卢克莱修低估,这位充满诗情画意的拉丁哲学家,曾写过:“傻瓜会认为最高的山和他所观察过最高的山一样高。”丹尼尔·卡尼曼(Daniel Kahneman)为了支持霍华德·昆鲁斯的研究工作,曾写道:“无论是个人还是政府的保护行动,通常都是在实际曾经经历的最大灾难的基础上设计出来的,而对更严重的灾难,其实很难能想象出来。”譬如在古埃及的法老王时代,人们记录着监测到尼罗河高水位的标记,并以此作为农业最糟糕的情况。似乎并没有经济学家测试过这个显而易见的事情:极端事件根据过去的经验是否有减少呢?回溯测试可能会回复说:“没有,真是对不起啊。”
1707610397
1707610398 同样危险的轻率行为也可以在福岛核反应堆事件中见到,福岛核反应堆是根据过去最糟糕的结果而建成的,但没有想象和进行推断更糟糕的结果。大自然不像风险工程师,它不会为之前从未发生过的做准备,也不会总是假设更糟糕的危害随时可能发生。所以,如果人类打的是上一场战争,而大自然打的便是下一场战争。当然,我们的过度补偿是有着生物限制性的。这种形式的冗余,比起我们人类心智,仍然具有极大的外推性,而人类的心智则是具有内推性。
1707610399
1707610400 伟大的数学家贝努瓦·曼德尔布罗特(Benoit Mandelbrot)离开我们已有7年了,他曾在自然和经济及历史事件的概率中验证过,相同的不规则碎片具有自相似性。亲眼验证这两个领域如何在基于碎片冗余的概念下合二为一,着实让人激动无比。
1707610401
1707610402 附注:在一般科学论述中,“适应度”这个词并不精准。我无法弄清楚到底所谓的“达尔文适应度”是属于目前环境的内推适应,还是包含统计上的外推成分。换而言之,鲁棒性(不被压力伤害)和我所称作的反易脆性(由应激源而获益),这二者有着显著的差异。
1707610403
1707610404
1707610405
1707610406
1707610407 世界因何美妙而优雅地运行 [:1707606732]
1707610408 世界因何美妙而优雅地运行 121NATURE IS CLEVERER THAN WE ARE大自然远比人类更智慧
1707610409
1707610410 特伦斯·谢诺沃斯基(Terrence J.Sejnowski)
1707610411
1707610412 萨尔克生物研究所计算神经科学家,弗朗西斯·克里克讲席教授,合著有《计算型大脑》(The Computational Brain)。
1707610413
1707610414 在 我们的一生当中,我们慎重作出的每一个重要决策,都在我们的心中留下了清晰的印象,比如从事何种职业、居于何处、与何人相伴一生。但与此信条相反的是,生物学方面的证据表明决策过程发在一个古老的大脑系统之中,该系统被称为基底神经节,那是意识无法进入的大脑回路。尽管如此,心智却尽心尽力地为决策编造着合理的阐释。
1707610415
1707610416 引领该结论的科学线索始于对蜜蜂的观察。工蜂在春天的田野里采集花蜜,通过花的颜色、香气和形状来识别花蜜。蜂脑中的学习回路集中在下颚神经髓腹侧非成对中央细胞(VUMmx1),即接收感官输入的单一神经元,在这之后,再接收花蜜的信息,然后当蜜蜂下一次见到这种花时,它就学会了预测花蜜的价值。这个过程中的延迟相当重要,因为其关键是进行预判,而不是单纯的关联。它同时也是时间差分学习(TD)的核心概念,这包括去学习一系列能达成目标的决定,尤其是在不确定的环境中是极为有效的,比如说我们生活的这个地球。
1707610417
1707610418 在我们的中脑深处有一个小组神经元,对决策起着非常重要的作用,这些神经元在最早的脊椎动物祖先中被发现,之后又扩展到整个皮层和基底神经节。这些神经元释放的神经传导物质叫作多巴胺,它对我们的行为有着巨大的影响。多巴胺被誉为“奖励分子”,但更重要的是,这些神经元有着预测奖励的能力,比如如果从事这样的工作,我会有多快乐?多巴胺神经元是动机与执行时间差分学习的核心,就如同VUMmx1一样。
1707610419
1707610420 时间差分学习解决了找寻达成目标最快捷路径的问题。这是一种即时的演算法,因为在达成目标的过程中,这种演算法可以通过探索发现中间决策的价值。要做到这点,必须创建一个内部的评估函数,用于预测行动的后果。多巴胺神经元能够评估整个皮质当前的状态,并通知大脑在当前状态下最好的行动路径。在许多情形下,最好的行动路径当然是一种猜测,但由于猜测可以不断得以改进,所以时间差分学习会随着时间的流逝而创造出玄妙深奥的价值函数。多巴胺可能是你偶然经历过的“直觉”的源泉。
1707610421
1707610422 在你反复掂量各种选项时,具有前瞻性的大脑回路正在对每个情况进行着评估,多巴胺的瞬间浓度会记住每个决策的预测值。多巴胺的浓度与你的动机强弱相当,也就是高浓度的多巴胺预示着高期望值的奖励,而你也会有更强的动机去追求目标。这在运动系统中表现得更为直接:多巴胺的浓度较高时,会让动作更快。可卡因和安非他命之所以会让人成瘾,是因为这些药物会使多巴胺活性增加,并劫持大脑内部奖励系统。降低多巴胺含量会引发快感缺失,使得无力体验快感;而失去多巴胺神经元则会导致帕金森氏病,让人失去行动和思考的能力。
1707610423
1707610424 时间差分学习威力强大,因为它结合了许多不同维度的价值信息,实际上,在达成遥远目标的过程中,时间差分学习是通过把不相关的事物放在一起做比较而达到效果的,譬如比较苹果和橙子。这很重要,原因就在于要在诸多变数和未知中作出理性决策绝非易事。如果你拥有一个内部系统,该系统能够作出快速的、良好的猜测,这就是你所拥有的一项巨大的优势,在需要快速作出决策之际,不同的决定很有可能就会产生生与死的差别。时间差分学习依赖你人生经验的总和。它在个体都记不住经验细节的时候,就会提取这些经验中的本质要素来帮助我们记忆。
1707610425
1707610426 时间差分学习同时对心理学家训练老鼠和鸽子执行简单任务的实验作出了阐释。增强学习算法,在传统上被认为不太能解释清楚这样的复杂行为,因为来自环境的反馈最小。尽管如此,强化学习几乎适用于所有物种,并会促使一些形式最为复杂的感觉得以协调,比如说钢琴演奏和发表演讲。强化学习已经经过了亿万年的进化萃取,无数物种都从中获益匪浅,尤其是我们人类更是如此。
1707610427
1707610428 那么时间差分学习能够解决多复杂的问题呢?双陆棋是一种电脑程序,其内容是通过和自己比赛,学会如何玩双陆棋。这种方法的困难在于,只有在比赛结束后才能获得奖励,所以玩家不太清楚到底是哪几步棋下得不错,才赢得了最后的胜利。在一开始玩游戏时,玩家只知道游戏规则,但不了解游戏的策略。在和自己下过多次后,玩家可以应用时间差分学习来创造价值函数,对游戏中棋子的布局进行评估,这个游戏让玩家从初学者攀升到专家级别,其在整个过程中都采用类似于人类使用的巧妙策略。经过百万次后,玩家就可以达到总冠军的级别,并且它还会出现让人类专家都惊讶的新布局。类似的游戏途径在围棋中也取得了不俗的表现,并正在往职业级别迈进。
[ 上一页 ]  [ :1.707610379e+09 ]  [ 下一页 ]