1702376780
特里弗斯认为,人类情感和体验中的很大一部分,譬如感激、同情、内疚、信任、友谊以及道德败坏,都源于同样简单的互惠逻辑,与大鱼和小鱼清洁工之间的关系如出一辙。这一理论建立在先人对社会行为受到互惠驱动的解释之上。亚里士多德在《尼各马可伦理学》(Nicomachean Ethics)一书中讲到,最理想的友谊建立在平等的关系基础上,而只有真诚的互惠,才能让这样的关系成为可能。在柏拉图的《克里托篇》(Crito)中,苏格拉底认为,市民是否以感恩的责任感去遵守国家法律,和他们对父母生养教育所怀有的感恩之心是相同的。总的说来,一个事实贯穿始终,那就是,互惠指导一切。
1702376781
1702376782
重复囚徒困境
1702376783
1702376784
囚徒困境理论形成于1950年,至今已出现多种变形和演绎。其他学者也对这场博弈进行过重复性试验,而特里弗斯则将重复囚徒困境用于动物行为的分析,并因此将这一理论推向了新的高度。重复囚徒困境,在吸血蝙蝠群落和鱼儿在珊瑚礁上建立的清洁站中都可能出现,特里弗斯在论文中也对这些动物的行为进行了描述。
1702376785
1702376786
但是,一遍遍地重复囚徒困境究竟会发生什么,第一次提出这个问题的时间实际上是先于特里弗斯的分析的。1965年,两位学者共同展开了对这个问题的研究:艾伯特·查玛(Albert Chammah)是从叙利亚来到美国学习工业工程的移民,而阿纳托尔·拉波波特(Anatol Rapoport)是生于俄罗斯的著名数学家兼心理学家,他利用博弈论去探索纯理性思维的边界,后来又投身于全球和平事业。在他们合著的《囚徒困境》(Prisoner’s Dilema)一书中,他们针对这一博弈的多次试验进行了讲解。
1702376787
1702376788
就在特里弗斯作出理论贡献的同时,以色列数学家罗伯特·J·奥曼(Robert J. Aumann)也对博弈论提出了重要的见解。奥曼曾于20世纪60年代在冷战军备控制谈判中担任顾问,后来于2005年获得了诺贝尔经济学奖。奥曼对重复相遇的结果进行了分析,并针对不同的情况给出了合作的先决条件。举例来说,这些情况包括当有很多参与者出现时、当互动不频繁时,以及当参与者的行为缺乏透明度时等。
1702376789
1702376790
在前文中分析过的囚徒困境回报矩阵中,只进行一轮的博弈,采取背叛的行为是符合逻辑的。但奥曼的研究告诉我们,即使当玩家有着强烈的短期利益冲突时,重复性博弈也能产生和平的合作行为。一位玩家会与另一位玩家合作,因为他知道,如果今天他被对方欺骗了,那么明天他就可以针对这个欺骗行为采取惩罚对方的措施。对复仇性报复行为的规避,似乎为友善的合作铺平了道路。从这个角度来看,从自我利益出发而进行的理性思考的确可以催生合作。奥曼将这一见解称为“无名氏定理”(Folk Theorem),它就像许多民歌一样,被人们口口相传,找不到最初的作者,而且在传播过程中也经过了许多人的修饰和改造。1959年,他又将这一理论发展为多位玩家之间的博弈,其中一些玩家会形成团伙,共同对付另一些玩家。
1702376791
1702376792
无名氏定理虽然强大,但并没有告诉你应该在重复性博弈中采取什么样的行动。这一定理实际是说,有一种策略可以引发理性对手的合作行为,但却没有说明什么样的策略是好的,什么样的策略是不好的。因此,举例来看,我们可以说冷酷策略(Grim Strategy)是能够引发合作的,即只要你合作,我就合作,但如果你背叛了一次,我就会永久性地采取背叛行为。然而在现实之中,这样的策略却远非可以激发出长期博弈中合作态度的最佳方法。
1702376793
1702376794
1702376795
1702376796
1702376797
为了找到玩这个游戏的方法,思想家们不得不等待一场新式比赛的打响,并从这样一场比赛中看出重复囚徒困境中的所有细微差别。密歇根大学政治科学家罗伯特·阿克塞尔罗德(Robert Axelrod)发现了其中的奥秘,并将成果写入了《合作的进化》(The Evolution of Cooperation)这一优秀的著作之中。这本著作的第一句话就令人兴趣顿生:“在充满利己主义者又缺乏中央集权的世界中,合作行为会在什么样的情况下产生?”阿克塞尔罗德用直白的语言,清晰地讲述了他所设计的新方法如何理清困境的谜团。
1702376798
1702376799
他组织了一场特殊的实验:在计算机上进行一次虚拟比赛。参加比赛的各位“选手”是由众多科学家提交的计算机程序。重复性的囚徒困境循环赛就在这些程序之间展开。当时正值20世纪70年代末期,这样的思想在那个年代看来具有令人震惊的新奇感。为了让大家对这场比赛所处的时代背景有一个更好的把握,我们不妨回忆一下,在同一时期,商业性的投币视频游戏才刚刚问世。阿克塞尔罗德的思想并不是供人娱乐的小把戏。和容易厌倦走神的人类不一样,计算机不仅可以不知疲倦地在彼此之间执行命令和策略,还可以一丝不苟地遵守规则。
1702376800
1702376801
全世界的研究人员给阿克塞尔罗德邮寄来了14个不同的计算机程序。他还加上了自己的一个程序,这个程序会随机地采取合作和背叛的行为。之后,他将所有的程序放在一起,相互之间展开循环比赛。成功很容易判定——获胜的策略是在计算机中与所有其他策略进行比赛,并在走了200多步之后得分最高的那一个。在整场比赛中,阿克塞尔罗德一共走出了12万步,进行了24万种选择。
1702376802
1702376803
由于计算机允许参加比赛的程序拥有无限的复杂性,有人可能会认为,最大、最“聪明”的程序才会获得胜利。但大小并不能决定一切。事实上,最简单的一位“选手”,反而轻而易举地获得了胜利,这让许多理论家大跌眼镜。最终的冠军,竟然是仅有4行的计算机程序!而这部程序的设计者,就是阿纳托尔·拉波波特。
1702376804
1702376805
这部程序的策略被命名为“以牙还牙”,第一步采取合作态度,之后的每一步都重复对方之前的一步。这一策略比冷酷策略要更加宽容。冷酷策略只消对手一步背叛,就会激发出自身永无休止的变节。
1702376806
1702376807
1702376808
1702376809
1702376810
脱离开囚徒困境的限定,很容易就能想明白采取简单策略的优势。如果你太过聪明,你的对手可能就会发现很难读懂你的意图;而如果你表现得太过迟钝、含糊或令人费解,你的对手就不会产生与你合作的动机。同样,如果一个程序(或一个人)可以清楚明确地采取行动并发出信号,让人感觉它(他)不会轻易变卦,那么与其合作就是一个很合理的选择。
1702376811
1702376812
令人惊讶的是,这个发现竟然一点儿都不新鲜。参加计算机囚徒困境比赛的选手已经了解到了这一强大的策略。实际上,20世纪70年代初发表的研究成果已经显示出“以牙还牙”策略的优异表现。这一策略让人回想起冷战时期核军备竞赛的情形。当时,每一方都承诺,只要对方不使用原子弹和氢弹,自己就不会使用。许多参赛选手都试图在这一简单策略的基础之上对自己的程序进行提升。“出乎人们的意料,在提交的所有复杂程序中,竟然没有一个能与‘以牙还牙’最初的简单版本相抗衡。”阿克塞尔罗德评论道。
1702376813
1702376814
为了找到成功的秘诀,阿克塞尔罗德分别详细研究了高分和低分策略,发现其中一项属性表现出了特别的重要性。“这就是友善的属性,也就是说,永远不做第一个背叛的人。”这一属性很有意思,因为不会在对别人采取报复手段之后还心存芥蒂。由此,两位对手之间就会永远存在恢复“信任”的机会:如果对手进行和解,那么双方都能获得合作带来的好处。
1702376815
1702376816
阿克塞尔罗德又组织了第二场比赛,这一次共有6个国家的63个程序参赛,参赛选手中包括一位年仅10岁的计算机小爱好者,还有一群专业方向各异的大学教授。其中一份参赛作品来自于英国生物学家约翰·梅纳德·史密斯(John Maynard Smith),我们之后会对他做详细介绍。梅纳德·史密斯的作品名叫“一牙还两牙”,这一策略是说,除非对手接连两次采取背叛行为,否则就一直保持合作态度。梅纳德·史密斯在他所在的研究领域中广受尊敬,而在这次比赛中却仅排在第24位。
1702376817
1702376818
1702376819
1702376820
1702376821
而拉波波特则秉承了英国足球队的座右铭:“永不改变一支获胜的团队。”他再一次提交了“以牙还牙”策略,并再一次获得了胜利。由此可见,遵从这条简单的策略,的确可以有所回报。正是这场比赛,激起了卡尔·西格蒙德研究囚徒困境的兴趣,而他又通过那次山间谈话给了我灵感。罗伯特·阿克塞尔罗德的著作《合作的进化》,如今已实至名归地被公认为这一领域内的经典名著。
1702376822
1702376823
阿克塞尔罗德的计算机比赛对现实世界是否存在一些启迪意义呢?答案是肯定的。曼弗雷德·米林斯基(Manfred Milinski)于1987年报告了这类竞赛在现实生活中的一个实例。如今,米林斯基已是位于德国普伦的马克斯—普朗克进化生物学协会(Max Planck Institute for Evolutionary Biology)的主任。当时,米林斯基对棘鱼的行为进行了研究。当梭子鱼等大型掠食性鱼类出现时,棘鱼群中会有几条鱼儿主动接近,探查一下闯入者究竟有多大的危险性。对于这些“侦察兵”来说,“掠食者探查活动”有着极高的风险。但侦察得来的信息,不仅对它们自身有利,而且也能为整个鱼群带来好处。如果闯入者不是掠食类动物,或者刚刚吃饱、没有饿着肚子,那么这些小鱼就不用逃开。这种对逃跑必要性的评估行为,看似有些愚蠢,但实则非常重要,因为在它们天然的栖息地中,常有许多梭子鱼和其他鱼类游来游去,所以一碰到大鱼就逃开并不是最佳的策略——很可能刚从一位掠食者眼前跑掉,就一不小心钻进了另一位掠食者的嘴里。
1702376824
1702376825
米林斯基发现,棘鱼在这种高风险的探查活动过程中利用了“以牙还牙”策略。如果附近出现了一条梭子鱼,两条棘鱼往往会一起冲刺,游向掠食者的大嘴,去一探究竟。每一次冲刺,都可以被看作是困境博弈中的一轮。对于参加博弈的两条鱼来说,进行合作对双方都有好处,可以降低被大鱼吃掉的风险。这是因为“掠食者效应”起了作用:梭子鱼在决定首先攻击哪只或哪群猎物的时候,会浪费掉宝贵的时间。这也是“布里丹之驴”悖论在现实中的体现。这一悖论是讲,一头驴不知在两堆干草中如何选择,最后饥饿而死。然而,每只小鱼却都有充分的动机在行进过程中稍微落后一点,将一部分风险转嫁到另一只棘鱼身上。
1702376826
1702376827
为了弄明白这些小鱼脑子里在想什么,米林斯基非常有创造力地在实验中用上了镜子。当把镜子置于合适的位置时,就能生成一种幻象,让一条棘鱼感觉有另一条棘鱼在陪伴它一同冲刺。而将镜子稍作倾斜,米林斯基就能让棘鱼感觉,它镜中的“同伴”是合作——与它共同前行,还是背叛——落在后面,就像是打头阵的军官慢慢退到队尾、避开危险的前线。遇到镜中的小鱼“背叛”自己时,领头的小鱼会采取减速或掉头的对策,中途放弃它的侦察任务。如果镜中的小鱼和“侦察兵”保持同样的速度,那么后者就会比独自执行任务时更接近掠食者。
1702376828
[
上一页 ]
[ :1.70237678e+09 ]
[
下一页 ]