打字猴:1.702376788e+09

1702376788 就在特里弗斯作出理论贡献的同时，以色列数学家罗伯特·J·奥曼（Robert J. Aumann）也对博弈论提出了重要的见解。奥曼曾于20世纪60年代在冷战军备控制谈判中担任顾问，后来于2005年获得了诺贝尔经济学奖。奥曼对重复相遇的结果进行了分析，并针对不同的情况给出了合作的先决条件。举例来说，这些情况包括当有很多参与者出现时、当互动不频繁时，以及当参与者的行为缺乏透明度时等。

1702376789

1702376790 在前文中分析过的囚徒困境回报矩阵中，只进行一轮的博弈，采取背叛的行为是符合逻辑的。但奥曼的研究告诉我们，即使当玩家有着强烈的短期利益冲突时，重复性博弈也能产生和平的合作行为。一位玩家会与另一位玩家合作，因为他知道，如果今天他被对方欺骗了，那么明天他就可以针对这个欺骗行为采取惩罚对方的措施。对复仇性报复行为的规避，似乎为友善的合作铺平了道路。从这个角度来看，从自我利益出发而进行的理性思考的确可以催生合作。奥曼将这一见解称为“无名氏定理”（Folk Theorem），它就像许多民歌一样，被人们口口相传，找不到最初的作者，而且在传播过程中也经过了许多人的修饰和改造。1959年，他又将这一理论发展为多位玩家之间的博弈，其中一些玩家会形成团伙，共同对付另一些玩家。

1702376791

1702376792 无名氏定理虽然强大，但并没有告诉你应该在重复性博弈中采取什么样的行动。这一定理实际是说，有一种策略可以引发理性对手的合作行为，但却没有说明什么样的策略是好的，什么样的策略是不好的。因此，举例来看，我们可以说冷酷策略（Grim Strategy）是能够引发合作的，即只要你合作，我就合作，但如果你背叛了一次，我就会永久性地采取背叛行为。然而在现实之中，这样的策略却远非可以激发出长期博弈中合作态度的最佳方法。

1702376793

1702376794

1702376795

1702376796

1702376797 为了找到玩这个游戏的方法，思想家们不得不等待一场新式比赛的打响，并从这样一场比赛中看出重复囚徒困境中的所有细微差别。密歇根大学政治科学家罗伯特·阿克塞尔罗德（Robert Axelrod）发现了其中的奥秘，并将成果写入了《合作的进化》（The Evolution of Cooperation）这一优秀的著作之中。这本著作的第一句话就令人兴趣顿生：“在充满利己主义者又缺乏中央集权的世界中，合作行为会在什么样的情况下产生？”阿克塞尔罗德用直白的语言，清晰地讲述了他所设计的新方法如何理清困境的谜团。

1702376798

1702376799 他组织了一场特殊的实验：在计算机上进行一次虚拟比赛。参加比赛的各位“选手”是由众多科学家提交的计算机程序。重复性的囚徒困境循环赛就在这些程序之间展开。当时正值20世纪70年代末期，这样的思想在那个年代看来具有令人震惊的新奇感。为了让大家对这场比赛所处的时代背景有一个更好的把握，我们不妨回忆一下，在同一时期，商业性的投币视频游戏才刚刚问世。阿克塞尔罗德的思想并不是供人娱乐的小把戏。和容易厌倦走神的人类不一样，计算机不仅可以不知疲倦地在彼此之间执行命令和策略，还可以一丝不苟地遵守规则。

1702376800

1702376801 全世界的研究人员给阿克塞尔罗德邮寄来了14个不同的计算机程序。他还加上了自己的一个程序，这个程序会随机地采取合作和背叛的行为。之后，他将所有的程序放在一起，相互之间展开循环比赛。成功很容易判定——获胜的策略是在计算机中与所有其他策略进行比赛，并在走了200多步之后得分最高的那一个。在整场比赛中，阿克塞尔罗德一共走出了12万步，进行了24万种选择。

1702376802

1702376803 由于计算机允许参加比赛的程序拥有无限的复杂性，有人可能会认为，最大、最“聪明”的程序才会获得胜利。但大小并不能决定一切。事实上，最简单的一位“选手”，反而轻而易举地获得了胜利，这让许多理论家大跌眼镜。最终的冠军，竟然是仅有4行的计算机程序！而这部程序的设计者，就是阿纳托尔·拉波波特。

1702376804

1702376805 这部程序的策略被命名为“以牙还牙”，第一步采取合作态度，之后的每一步都重复对方之前的一步。这一策略比冷酷策略要更加宽容。冷酷策略只消对手一步背叛，就会激发出自身永无休止的变节。

1702376806

1702376807

1702376808

1702376809

1702376810 脱离开囚徒困境的限定，很容易就能想明白采取简单策略的优势。如果你太过聪明，你的对手可能就会发现很难读懂你的意图；而如果你表现得太过迟钝、含糊或令人费解，你的对手就不会产生与你合作的动机。同样，如果一个程序（或一个人）可以清楚明确地采取行动并发出信号，让人感觉它（他）不会轻易变卦，那么与其合作就是一个很合理的选择。

1702376811

1702376812 令人惊讶的是，这个发现竟然一点儿都不新鲜。参加计算机囚徒困境比赛的选手已经了解到了这一强大的策略。实际上，20世纪70年代初发表的研究成果已经显示出“以牙还牙”策略的优异表现。这一策略让人回想起冷战时期核军备竞赛的情形。当时，每一方都承诺，只要对方不使用原子弹和氢弹，自己就不会使用。许多参赛选手都试图在这一简单策略的基础之上对自己的程序进行提升。“出乎人们的意料，在提交的所有复杂程序中，竟然没有一个能与‘以牙还牙’最初的简单版本相抗衡。”阿克塞尔罗德评论道。

1702376813

1702376814 为了找到成功的秘诀，阿克塞尔罗德分别详细研究了高分和低分策略，发现其中一项属性表现出了特别的重要性。“这就是友善的属性，也就是说，永远不做第一个背叛的人。”这一属性很有意思，因为不会在对别人采取报复手段之后还心存芥蒂。由此，两位对手之间就会永远存在恢复“信任”的机会：如果对手进行和解，那么双方都能获得合作带来的好处。

1702376815

1702376816 阿克塞尔罗德又组织了第二场比赛，这一次共有6个国家的63个程序参赛，参赛选手中包括一位年仅10岁的计算机小爱好者，还有一群专业方向各异的大学教授。其中一份参赛作品来自于英国生物学家约翰·梅纳德·史密斯（John Maynard Smith），我们之后会对他做详细介绍。梅纳德·史密斯的作品名叫“一牙还两牙”，这一策略是说，除非对手接连两次采取背叛行为，否则就一直保持合作态度。梅纳德·史密斯在他所在的研究领域中广受尊敬，而在这次比赛中却仅排在第24位。

1702376817

1702376818

1702376819

1702376820

1702376821 而拉波波特则秉承了英国足球队的座右铭：“永不改变一支获胜的团队。”他再一次提交了“以牙还牙”策略，并再一次获得了胜利。由此可见，遵从这条简单的策略，的确可以有所回报。正是这场比赛，激起了卡尔·西格蒙德研究囚徒困境的兴趣，而他又通过那次山间谈话给了我灵感。罗伯特·阿克塞尔罗德的著作《合作的进化》，如今已实至名归地被公认为这一领域内的经典名著。

1702376822

1702376823 阿克塞尔罗德的计算机比赛对现实世界是否存在一些启迪意义呢？答案是肯定的。曼弗雷德·米林斯基（Manfred Milinski）于1987年报告了这类竞赛在现实生活中的一个实例。如今，米林斯基已是位于德国普伦的马克斯—普朗克进化生物学协会（Max Planck Institute for Evolutionary Biology）的主任。当时，米林斯基对棘鱼的行为进行了研究。当梭子鱼等大型掠食性鱼类出现时，棘鱼群中会有几条鱼儿主动接近，探查一下闯入者究竟有多大的危险性。对于这些“侦察兵”来说，“掠食者探查活动”有着极高的风险。但侦察得来的信息，不仅对它们自身有利，而且也能为整个鱼群带来好处。如果闯入者不是掠食类动物，或者刚刚吃饱、没有饿着肚子，那么这些小鱼就不用逃开。这种对逃跑必要性的评估行为，看似有些愚蠢，但实则非常重要，因为在它们天然的栖息地中，常有许多梭子鱼和其他鱼类游来游去，所以一碰到大鱼就逃开并不是最佳的策略——很可能刚从一位掠食者眼前跑掉，就一不小心钻进了另一位掠食者的嘴里。

1702376824

1702376825 米林斯基发现，棘鱼在这种高风险的探查活动过程中利用了“以牙还牙”策略。如果附近出现了一条梭子鱼，两条棘鱼往往会一起冲刺，游向掠食者的大嘴，去一探究竟。每一次冲刺，都可以被看作是困境博弈中的一轮。对于参加博弈的两条鱼来说，进行合作对双方都有好处，可以降低被大鱼吃掉的风险。这是因为“掠食者效应”起了作用：梭子鱼在决定首先攻击哪只或哪群猎物的时候，会浪费掉宝贵的时间。这也是“布里丹之驴”悖论在现实中的体现。这一悖论是讲，一头驴不知在两堆干草中如何选择，最后饥饿而死。然而，每只小鱼却都有充分的动机在行进过程中稍微落后一点，将一部分风险转嫁到另一只棘鱼身上。

1702376826

1702376827 为了弄明白这些小鱼脑子里在想什么，米林斯基非常有创造力地在实验中用上了镜子。当把镜子置于合适的位置时，就能生成一种幻象，让一条棘鱼感觉有另一条棘鱼在陪伴它一同冲刺。而将镜子稍作倾斜，米林斯基就能让棘鱼感觉，它镜中的“同伴”是合作——与它共同前行，还是背叛——落在后面，就像是打头阵的军官慢慢退到队尾、避开危险的前线。遇到镜中的小鱼“背叛”自己时，领头的小鱼会采取减速或掉头的对策，中途放弃它的侦察任务。如果镜中的小鱼和“侦察兵”保持同样的速度，那么后者就会比独自执行任务时更接近掠食者。

1702376828

1702376829 超级合作者 [:1702376301]

1702376830 并非有意的背叛

1702376831

1702376832 到目前为止，一切都直截了当、易于理解。但“以牙还牙”策略存在一个问题，而这个问题在毫无缺陷的计算机程序互动过程中并不能直接体现出来——人类和其他动物会犯错误。有时脑子会“短路”，有时玩家会分心，有时还会出现情绪起伏，可能有一天事事不顺，心情跌到谷底。毕竟，人无完人。其中一类错误是由于“颤抖的手”：我想要合作，但却因为疏忽而未能做到。另一类错误是由于“糊涂的脑子”：我认定这个人心怀叵测，在上一轮博弈中背叛了我，而事实上却不是这么回事，可能我把这个人错当成别人了。颤抖的手和糊涂的脑子，共同导致了我所谓的有“噪声”的互动。

1702376833

1702376834 噪声在合作进化过程中所扮演的重要角色，是由牛津大学的罗伯特·梅在《自然》杂志上发表的一篇论文中首先指出的。梅曾经是一位优秀的物理学家，后来对理论生物学的发展也产生了深远的影响。鲍勃（这位澳大利亚人喜欢被称为“鲍勃”）最著名的成就，就是实现了以数学基础进行生态学分析的跨越。他在论文中讲到，进化生物学家应该对“失误”在重复囚徒困境中产生的影响进行研究。他认识到，从像阿克塞尔罗德竞赛这样天衣无缝的完美博弈中得出的结论，并不一定具有实际意义。

1702376835

1702376836 他提出的这一观点十分重要。因为即使是不常出现的错误，也可能产生破坏性的后果。如果博弈双方都采取同样的“以牙还牙”策略，就会引发永无止境的报复行为。这是因为“以牙还牙”策略只会对背叛者进行反击，因此一旦出现干扰信号或疏忽，就可能令“以牙还牙”的行为陷入恶性循环，在博弈双方之间制造出比罗密欧与朱丽叶家族、哈特菲尔德和麦克伊，或科西嘉岛仇杀更加惨重的血海深仇。很明显，结束所有这些残忍复仇恶性循环的办法，就是忘掉过去，既往不咎。举例来说，可以间歇性地采取报复行为，或者靠掷骰子的方法来决定是否进行报复。在鲍勃这一重要观点的启发之下，我对阿克塞尔罗德的开创性工作成果进行了延伸，将噪声的影响考虑进来，让这一理论更加贴近现实生活。

1702376837

[ 上一页 ] [ :1.702376788e+09 ] [ 下一页 ]