1702376830
并非有意的背叛
1702376831
1702376832
到目前为止,一切都直截了当、易于理解。但“以牙还牙”策略存在一个问题,而这个问题在毫无缺陷的计算机程序互动过程中并不能直接体现出来——人类和其他动物会犯错误。有时脑子会“短路”,有时玩家会分心,有时还会出现情绪起伏,可能有一天事事不顺,心情跌到谷底。毕竟,人无完人。其中一类错误是由于“颤抖的手”:我想要合作,但却因为疏忽而未能做到。另一类错误是由于“糊涂的脑子”:我认定这个人心怀叵测,在上一轮博弈中背叛了我,而事实上却不是这么回事,可能我把这个人错当成别人了。颤抖的手和糊涂的脑子,共同导致了我所谓的有“噪声”的互动。
1702376833
1702376834
噪声在合作进化过程中所扮演的重要角色,是由牛津大学的罗伯特·梅在《自然》杂志上发表的一篇论文中首先指出的。梅曾经是一位优秀的物理学家,后来对理论生物学的发展也产生了深远的影响。鲍勃(这位澳大利亚人喜欢被称为“鲍勃”)最著名的成就,就是实现了以数学基础进行生态学分析的跨越。他在论文中讲到,进化生物学家应该对“失误”在重复囚徒困境中产生的影响进行研究。他认识到,从像阿克塞尔罗德竞赛这样天衣无缝的完美博弈中得出的结论,并不一定具有实际意义。
1702376835
1702376836
他提出的这一观点十分重要。因为即使是不常出现的错误,也可能产生破坏性的后果。如果博弈双方都采取同样的“以牙还牙”策略,就会引发永无止境的报复行为。这是因为“以牙还牙”策略只会对背叛者进行反击,因此一旦出现干扰信号或疏忽,就可能令“以牙还牙”的行为陷入恶性循环,在博弈双方之间制造出比罗密欧与朱丽叶家族、哈特菲尔德和麦克伊,或科西嘉岛仇杀更加惨重的血海深仇。很明显,结束所有这些残忍复仇恶性循环的办法,就是忘掉过去,既往不咎。举例来说,可以间歇性地采取报复行为,或者靠掷骰子的方法来决定是否进行报复。在鲍勃这一重要观点的启发之下,我对阿克塞尔罗德的开创性工作成果进行了延伸,将噪声的影响考虑进来,让这一理论更加贴近现实生活。
1702376837
1702376839
偶尔宽容的魔力
1702376840
1702376841
在博士研究生求学期间,我和卡尔一起设计出了一种方法,将困惑、疏忽和失误考虑在内。用术语来说就是,我们利用概率性策略替代了传统的确定性策略,从而使得博弈的结果更加模糊和随机。我们决定对存在噪声的合作进化进行研究,并在阿克塞尔罗德开创性成就的基础上,进行了一场计算机概率性竞赛。我们的想法,是对因突变和自然选择而随机出现的各种策略加以利用。
1702376842
1702376843
所有的策略都可能受到偶然性的影响。这些策略会在对方采取合作之后,以某一概率进行合作;而在对方背叛之后,也会以某一概率进行合作。可以这样认为:我们将不同程度的“宽恕”加入到了策略组合的研究之中。有的策略是会在两次背叛行为中宽恕一次;有的策略是会在5次背叛行为中宽恕一次,以此类推;而有些策略则是毫不通融的——这些“旧约全书”式的策略会采取永不宽恕的态度,就像“冷漠策略”一样,在对方背叛一次之后永远不再合作。
1702376844
1702376845
为了研究合作的演进,我们将各种各样的策略与自然选择的过程调配在一起,如此一来,获胜的策略就能成倍增加,而失败的竞争对手则会被淘汰。得分最高的策略将获得子孙后代作为奖励——出现更多和它们一样的策略版本,而这些版本也要参加接下来的博弈。同样,那些表现欠佳的策略就会被消灭。为了进一步体现真实性,我们进行了编排,让繁殖的过程带有一些不完美的因素。有时,突变也可能产生新的策略。
1702376846
1702376847
卡尔和我坐下来,观察着我们创造出的这些策略在一代又一代的繁衍过程中不断兴衰、变化。我们热切盼望能看到一个策略最终成为胜利者。虽然没有一条进化轨迹会出现重复,但我们却观察到了总体上的规律性和连贯性。
1702376848
1702376849
竞赛总是从一种“原始的混沌状态”开始的。也就是说,初始之时仅有随机策略的存在。在这种混乱状态下,“永远背叛”策略总是会在早期占据领先位置:就像许多好莱坞电影中的情节一样,坏蛋一开始总是一幅自鸣得意的样子。到了100代左右的时候,“永远背叛”策略在我们的竞赛中占据了支配地位。生命的剧情似乎有着令人沮丧的序幕,而大自然则冷眼旁观,不予合作。但这一切之中,却存在着一线希望。面对这个冷酷的敌人,一小群被围困的“以牙还牙”策略玩家死死坚守在灭绝的边缘。还是像好莱坞式的英雄一样,属于他们的胜利终将会到来——当盘剥者将所有人盘剥一空之后,当全部的弱者都被清扫干净之时,博弈的进展方向突然出现了转折。卡尔和我满心欢喜地看着“永远背叛”策略的玩家逐渐被削弱并最终消失,为合作的成功兴起扫平了道路。
1702376850
1702376851
1702376852
1702376853
1702376854
当遭遇死硬派背叛者的抵抗之时,孤立的“以牙还牙”策略玩家的表现会比永远背叛的无赖要差一些,因为“以牙还牙”总是要在输掉第一轮之后才能尝到血的教训,转换到复仇状态。但当与其他“以牙还牙”策略玩家对战时,则会比“永远背叛”策略玩家和其他强硬派的表现好出很多。在由“永远背叛”和“以牙还牙”策略玩家组成的混合群体中,虽然后者占少数,但“友善”的态度会开始繁殖,并很快在博弈中居于支配地位。通常情况下,背叛者的表现十分糟糕,并最终销声匿迹,留下一群全部秉承“以牙还牙”策略的玩家。
1702376855
1702376856
但卡尔和我却满心期待着惊喜的出现。在我们的计算机竞赛中,“以牙还牙”策略玩家最终并没有获得胜利,而是输给了它们更加友善的表兄弟。这位表兄弟利用了“以牙还牙”的致命缺陷——对偶尔出现的失误不够宽容。在几代之后,进化过程就会垂青另一个策略,也就是我们所称的“宽宏以牙还牙”。此时,自然选择过程转向了最优的宽容程度:永远以合作的态度来回报对方的合作,而当遇到背叛时,在每三次背叛中采取一次合作(具体细节取决于所运用的回报价值)。你不能让对方知道你什么时候会表现出友善的态度,如果让对方知道了,就是犯了一个重大的错误(约翰·史密斯的“一牙还二牙”策略就会轻而易举地被交替性合作与背叛者所利用)。因此,为了不让对方知道,宽容与坚守行为是呈概率性的。这样一来,在对方作出背叛举动之后,我方是否采用既往不咎的态度,就要看运气,而并非必然。可以这样理解“宽宏以牙还牙”:永远不会忘记对方的好意,但会偶尔谅解对方的恶行。
1702376857
1702376858
1702376859
1702376860
1702376861
“宽宏以牙还牙”可以很轻松地取代“以牙还牙”,保护自身不受背叛者的盘剥,并且在很长一段时间内都处于支配地位。但由于竞赛的随机性,这一策略无法永远处于不可动摇的位置。我们观察到,一批“宽宏以牙还牙”策略玩家开始以几乎无法觉察的缓慢速度出现变化,并朝向更加仁慈的策略转移。最终,全体玩家表现出了一致的友善:全部采取合作态度。原因就在于,当每一个人都试图表现出友善的时候,宽容与谅解就会得到优厚的回报。玩家之间永远存在更快采取宽容态度的动机,因为最高的奖励来自于许多富有成效的(也就是合作性的)互动。现在,在适当的突变帮助下,背叛者们仍有再次崛起的可能。由永远合作的友善玩家组成的统一群体,在任何残留或新近出现的背叛者燃起的入侵火焰面前,就像枯草一般不堪一击。新的轮回便由此开始。
1702376862
1702376863
这些概率性博弈虽然在细节上多少有些差异,但总体上却遵循着同样的规律。卡尔和我发现,一些策略会逐渐壮大声势,而另一些则慢慢销声匿迹。总体来讲,这些周期与轮回的进化过程是可以预测的:从一成不变的“永远背叛”到“以牙还牙”,再到“宽宏以牙还牙”,之后会演变成为全部合作。最终,在一次毁灭性事件的作用之下,群体成员又再一次回到受卑鄙背叛者所支配的状态之中。
1702376864
1702376865
值得庆幸的是,在整场竞赛中,相对较为友善的策略占据主导的情况更多一些。当我们观察整场游戏的进展,并计算所有策略的平均出现时长时发现,最为常见的一种策略就是“宽宏以牙还牙”。而令人惋惜的是,在现实世界中,这种轮回可能会长达几年、几十年甚至几百年。无数事实告诉我们,人类历史也不乏这样的轮回:朝代不断更替;帝国兴衰更迭;公司崛起、占领市场之后,又在强大而富有创新精神的竞争对手面前土崩瓦解。
1702376866
1702376867
正如这些策略中任何一个都不会在竞赛中取得完胜一样,人类社会也将永远是合作者(守法公民)和背叛者(犯罪分子)的混合体。信仰也是同样的道理,某一种信仰的崛起必然伴随着另一种信仰的衰退。而正是这样的现实,激发了奥古斯汀(Augustine)的灵感,在罗马于公元410年被西哥特人洗劫之后,创作出了《上帝之城》(De civitate Dei)这部神学巨著。奥古斯汀希望能推翻罗马是因为接纳基督教而被削弱的说法,正如我们的计算机竞赛所证实的一样,伟大的帝国终将衰落。这就是那句名言“我虽跌倒,仍要再起”所要告诉我们的,“盛极而衰”也是同样的道理。
1702376868
1702376869
在过去几十年的发展过程中,我们可以看到,经济生活中同样存在着周期循环。虽然政府加强了监管,但人们还是能够随着时间的发展,想出妙计来加以规避。一段充满艰苦和辛劳的岁月过后,总会迎来舒适懒散的生活,人们便会在这时开始懈怠、偷懒,占尽体制的便宜。合作与背叛的轮回,是人生的主旋律。而我们的计算机模拟,是否能在无意之间发现对这一切的数学解释呢?
1702376870
1702376871
投奔牛津大学的鲍勃·梅
1702376872
1702376873
经过一年多的协作并发表了4篇论文之后,卡尔告诉我,我已经完成了所需要的研究,可以开始着手整理关于合作进化的博士论文了。于是,我立即开始整理工作成果。几天之后,我将论文递到他手里。他举起论文,从侧面仔细端详着这摞文件,摇摇头说:“博士论文必须要再厚一些。”第二天,我将同样一份论文交给了他,只不过将字号调大了一些,改成了双倍行间距。卡尔一眼便看穿了我的伎俩,但他毕竟是一位实用主义者。他看了看我的论文,说道:“就这么着吧。”
1702376874
1702376875
之后,卡尔建议我向领域内的领军人物——牛津大学的鲍勃·梅[3]申请一个职位。当时,鲍勃十分出名,因为他将数学的严谨注入到了生物学研究领域,以此来揭示生物世界中的深层秩序。针对稳定性是否是生态系统多样性的原因,以及反过来的多样性是否是稳定性的原因这两个课题,鲍勃进行了深入研究(研究发现,在生态系统中注入各种不同类型的生命体,并不能自动带来稳定性)。他还对昆虫及其寄生虫之间的关系进行了制图分析。利用数学模型,他揭示出了物种之间的联系如何引发个体数量的波动。通过这种方式,鲍勃将混沌概念引入生物学,并揭示出,看似随机而复杂的行为,其背后的规则其实很简单。我在家里写作这一段内容的时候,正坐在鲍勃提出这一发现时所用过的办公桌旁。这是他在帮我置办第一处房子家具时送来的礼物。
1702376876
1702376877
卡尔认为,我得到牛津大学工作机会的胜算并不大,因此我又申请了伯克利和哥廷根。我未来的人生、事业和一切,似乎都仰仗于这几封不太可靠的航空邮件。就在这些邮件飞向世界各地之时,我自身也陷入了浪漫而伤感的境地。当时,我即将与厄休拉完婚,我们在维也纳的时光就要告一段落。即将离家的忧愁与就要展开新旅程的兴奋混杂在一起,百感交集。我们两个人谁也不知道,哪里会是我们的归宿。
1702376878
[
上一页 ]
[ :1.702376829e+09 ]
[
下一页 ]