打字猴:1.70024314e+09
1700243140
1700243141 虽然严格来说,“针锋相对”并不是一个真正的进化稳定策略,但在实际操作中,将这一类基本善意又宽容、与“针锋相对”类似的策略近似看作进化稳定策略,也是可行的。这一类策略里甚至可以包括一小部分恶意策略。阿克塞尔罗德的研究后继有人,罗伯特·博伊德与杰弗里·洛伯鲍姆的研究成果是这些后续研究中最为有趣的。他们将“两报还一报”与另一个“针锋相对多疑版”(Suspicious Tit for Tat)的策略组合到一块儿。“针锋相对多疑版”近似于“针锋相对”,但本质上是一个恶意策略,虽然恶意程度不高。它只在第一回合采取“背叛”行动,之后的所有出牌与“针锋相对”完全相同。在一个“针锋相对”占主要地位的环境中,“针锋相对多疑版”并不走运,因为它的先行背叛导致了互相背叛的恶性循环。但当它遇上了“两报还一报”时,这场冤冤相报因对方的慈爱宽恕化解了,双方都能至少得到满分,而“针锋相对多疑版”还会因为其最初的背叛而获得更高的分数。博伊德和洛伯鲍姆的研究结果表明,“针锋相对”的群体可以被“两报还一报”与“针锋相对多疑版”的组合入侵影响。从进化论角度上说,则是“两报还一报”与“针锋相对多疑版”共生繁荣,进而影响了“针锋相对”的种群。几乎可以肯定,这种组合不仅不会消亡,还会以这种方式入侵相对稳定的种群。事实上,也许还有很多其他稍微恶意与极度圣洁策略的组合可以入侵种群。有人也许可以从这里看到人类生活的对照。
1700243142
1700243143 阿克塞尔罗德意识到“针锋相对”并不是严格意义上的进化稳定策略。于是他又创造了一个术语:集体稳定策略。由于在真正的进化稳定策略中,可以有不止一个策略同时达成集体稳定,另一方面,决定一个策略是否可以控制种群更取决于其运气,因此“永远背叛”的策略也可以和“针锋相对”一样稳定。在一个被“永远背叛”控制了的种群中,没有任何其他策略可以取胜。我们也可以将这种系统称为“双稳态”,而将“永远背叛”作为其中一个稳定点,“针锋相对”(或者其他最善良宽容策略的组合)为另一个稳定点。无论哪一方首先在种群中达到数量优势,都将继续保持稳定。
1700243144
1700243145 然而,这个数量优势如何量化?一个群体中,究竟需要多少“针锋相对”来保证其战胜“永远背叛”?这取决于“银行家”愿意在这场博弈中付出的具体数额。我们可以将此概括为一个决胜点。如果“针锋相对”可以超过这个决胜点,自然选择便会愈加偏爱“针锋相对”。另一方面,如果“永远背叛”超出了这个决胜点,自然选择则会更加偏爱它。你也许还记得,我们在第10章斤斤计较者与骗子的故事里,也曾与这个决胜点相遇过。
1700243146
1700243147 于是,获胜的关键显然取决于哪一方首先超过决胜点,而且我们还需要知道,有时主导种群还会变化,从一方变成另一方。我们假设现有的种群已经由“永远背叛”主导了,少数派的“针锋相对”难以互相碰面以获得共享利益。自然选择于是将该种群推向了“永远背叛”的极致。只有该种群通过随机转换,使主导的一方变为“针锋相对”,它才能继续推进“针锋相对”的发展,使得所有人都能从“银行家”(或者自然)处得到利益。然而,种群没有集体意愿,也没有集体意识或目的,它们不能控制发展走向。主导方的转换只能发生在自然界间接力量的作用下。
1700243148
1700243149 这种情况如何发生呢?一种回答是“运气”。但这个单词只能显示无知。它表示“由一些尚未知道、未能分辨的方式来决定”。我们可以比“运气”做得更好一些。我们可以想象少数派的“针锋相对”个体如何通过一个实际方法来增加其关键数目,探索“针锋相对”个体如何集合成足够的数量,使它们都可以从“银行家”处得到回报。
1700243150
1700243151 这种想法貌似可行,但实际上机会渺茫。这些相似的个体如何在小范围内集合到一起?在自然界中,最明显的方式是因基因关系——亲属而集合。大多数动物喜欢同自己的兄弟姐妹与表亲们,而不是种群中其他成员居住在一起。这并不一定是出于选择,而是自动跟随种群中的“黏性”。这里的“黏性”指的是任何使个体持续居住于出生地的趋势。比如在人类历史上,大部分地区的人都只居住在出生地以外几英里的地方(虽然现代社会已经不再如此)。因此,以亲属关系为线索的小团体逐渐形成。我曾经到访过爱尔兰西海岸一个偏远的岛,令我吃惊的是,那里几乎所有人都拥有巨大的耳朵。其中的原因很难解释为大耳朵适应当地天气(那里岸边的风特别大),这只能是因为岛上大多数居民都是亲缘相近的亲属。
1700243152
1700243153 基因相近的亲属们不仅面部特征相似,其他方面也有相近之处。比如,他们会因其基因趋势而互相模仿着采用(或不采用)“针锋相对”。于是,即使“针锋相对”在种群整体中已经稀少,它依然可能在局部广泛使用。在这个小圈子里,“针锋相对”的个体可以互相博弈,采取互相合作的方式来达到数目繁荣,即使在总体计算里它们依然处于弱势地位。
1700243154
1700243155 由此,最初仅占领小片地区的“针锋相对”个体,将随着小团体的逐渐扩大,逐渐向其他地区分散,甚至包括“永远背叛”群体占主导的地区。如果用区域地理的方式思考,我举的爱尔兰岛的例子则有些误导,因为那里的人被自然地理隔绝了。想象另一个例子:在迁入人口不多的人群中,即使这片地区的人们已经有了广泛持续的亲缘关系,所有人也只复制近邻(而不是远邻)的行为。
1700243156
1700243157 回头看看,“针锋相对”是可以超越决胜点的,它所需的只是这些个体的聚合,这一点在自然选择里可以很自然地发生。这个与生俱来的优点使得“针锋相对”即使在数目稀少的时候,也可以成功跨越决胜点而获得成功。但这个跨越只是单向的。“永远背叛”作为一个真正的进化稳定策略,并不可以使用个体聚合来跨越决胜点。相反的是,“永远背叛”个体的聚合,不仅不能彼此互助而获得群体繁荣,还会使各自的生存环境更加恶劣。它们无法暗自帮助对方获得“银行家”的奖赏,而只能把对方也拖下水。于是与“针锋相对”相反,“永远背叛”在亲属或种群聚合中得不到任何帮助。
1700243158
1700243159 所以,即使“针锋相对”并非真正的进化稳定策略,它却拥有更高的稳定性。这意味着什么?如果我们用长远的目光来看,“永远背叛”可以在相当长的一段时间内抵制其他策略的影响,但如果我们等上很长一段时间,也许是几千年后,“针锋相对”将最终聚集到足够的数目,跨越决胜点,其数量终将反弹。而反方向的发展并不可能,“永远背叛”无法在个体聚集中获得好处,因此也无法得到这种更高的稳定性。
1700243160
1700243161 如我们之前所见,“针锋相对”是一个善良的策略,这表示它永远不会首先背叛。它又是一个宽容的策略,表示它对过往的恩怨只有短期记忆。阿克塞尔罗德对“针锋相对”还有另一个令人回味的定义:不嫉妒。在阿克塞尔罗德的定义中,嫉妒是希望获得比对手更多的金钱,而不是追求从“银行家”手中得到绝对数量较大的收获。“不嫉妒”表示当对手获得与你一样的金钱时,只要大家都能从“银行家”处获得更大收获,你也同样高兴。“针锋相对”从没有“赢得”比赛,它从未从其对手处获得更多的利益,因为它除了报复之外从未背叛。它能得到的最好结果是与对手分享平局,但它尽量争取在每一场对弈中都能获得尽量高的共享分数。当我们考虑“针锋相对”与其他策略时,“对手”一词其实并不准确。然而,令人失望的是,当心理学家在人群中实验重复囚徒困境的博弈时,几乎所有选手都会嫉妒,于是获得的金钱也并不多。这表示许多人在潜意识中更倾向于击败对手,而不是与他人一同合作击败“银行家”。阿克塞尔罗德的实验表明,这是一个多么严重的错误。
1700243162
1700243163 但在所有博弈里并不都是错误。博弈理论家将博弈分为“零和”与“非零和”两种。“零和博弈”指一方的胜出即是对方的损失。棋类游戏便是一种“零和博弈”,因为博弈双方的目标是胜过对方,使对方产生损失。囚徒困境则是一种“非零和博弈”,在这里,“银行家”支付了金钱,博弈双方可以携手合作,一起笑到最后。
1700243164
1700243165 这让我想起了莎士比亚写过的一句精彩的台词:
1700243166
1700243167 “我们要做的第一件事,就是把所有律师都先杀了。”
1700243168
1700243169 ——《亨利六世》
1700243170
1700243171 在所谓“民事争议”中,事实上经常有很大空间可以合作。一个看似“零和博弈”的争议也许只要加入少许善意,便可以转化为双方互利的“非零和博弈”。下面拿离婚作为例子。一段好的婚姻明显是一个“非零和博弈”,充满了互助合作的空间。即使它瓦解,夫妻依然可以继续合作,以“非零和博弈”来看待离婚,并从中得到好处。如果孩子抚养权的判决问题并不是一个足够劝服夫妻合作的理由,双方律师的高昂费用也许更有说服力,因为它将给家庭财政造成巨大创伤。那么,如果一对理性文明的夫妻从一开始便一起雇用同一个律师,这是不是更合理呢?
1700243172
1700243173 答案却是否定的。至少在英格兰,还有今天美国几乎50个州中,法律——或者更严格地说,律师本身的职业规范并不允许他们这么做。律师只能接受夫妻双方中的一位作为客户,而拒绝另一方,迫使对方去寻找另一个律师,或者完全失去法律服务。这便是乐趣的开始。在另一个房间里,律师们开始谈“我们”和“他们”。这里的“我们”指的不是我和我的妻子,而是我和我的律师对抗她与她的律师。法庭上陈述的则是“史密斯诉史密斯”!(英国妻子多用夫姓。)无论夫妻双方是否感觉抗拒对方,或者他们是否愿意和睦解决问题,法庭已经假设他们之间存在对抗关系。谁能在这场“我赢你便输”的游戏里胜出呢?只有律师。
1700243174
1700243175 倒霉的夫妻被拖进了这么一场“零和博弈”中,律师们则可以享有油水肥厚的“非零和博弈”——因为史密斯夫妇提供了回报,而律师们专业剥削顾客的方式已经通过行业合作精细地被规范了。他们合作的一种方式是提出知道对方完全不会接受的提议,这可以激发对方提出另一个明知双方都不会接受的提议,循环往复。这些事实合作的“对手”所发的每一封律师函、每一个电话都在账单上多加一笔数目。运气不好的话,这个过程将持续几个月甚至几年,双方的花费越来越多。律师们并不需要坐在一起计算这些事情,相反,他们严格的独立性正是他们合作的主要方式,以此消耗着顾客的腰包。律师们甚至都没有感觉到他们所做的一切正是一个“非零和博弈”。就像我们有时见到的吸血蝙蝠一样,他们以一种精心设计的仪式进行着这场游戏。这个系统无须任何有意识的计划或者组织,已然自成一体。它逼迫我们走进一场“零和博弈”,顾客们得到了零,律师们得到了丰厚的非零。
1700243176
1700243177 我们该怎么做呢?莎士比亚的方法太过残酷,单单改变法律就简单多了。但大多数国会议员有法律背景,只有“零和博弈”心理。很难想象哪里存在比英国下议院更具对抗性的氛围了。(法庭至少还保持了辩论的斯文,因为律师们可以抱着“我博学的朋友将和我合作而笑到最后”的心理。)也许那些用心良苦的立法者和良心发现的律师需要学一点博弈论。只要律师以完全相反的方式工作,劝说顾客们放弃零和博弈的厮杀,就可以从庭外和解的非零和博弈中得到更多好处。
1700243178
1700243179 那么人类生活中的其他博弈呢?哪些是零和,哪些又是非零和?它们并不相同。我们应该在生活的哪些方面追求零和博弈,又在哪些方面追求非零和博弈呢?生活中哪些方面值得“嫉妒”,哪些又值得合作并打败“银行家”呢?举个例子,当我们和老板对工资讨价还价时,我们是被“嫉妒”驱使,还是通过合作让我们的真实收入最大化呢?在现实生活中,我们是否把“非零和博弈”误会为“零和博弈”,正如我们在那个心理实验中一样呢?我只能简单提出这些复杂的问题,因为他们的答案已经超出本书涵盖的范围了。
1700243180
1700243181 足球就是一场零和博弈。至少它一般是这样。少数情况下它能变成一个非零和博弈(英式橄榄球、澳大利亚橄榄球、美式橄榄球、爱尔兰橄榄球则一直是非零和博弈),这在1977年的英格兰足球联赛中发生过。联赛中的队伍被分为四级。俱乐部在比赛中互相对抗,以积分决定它们的晋级或降级。甲级联赛声名远扬,俱乐部可以趁机从巨大观众群中捞得丰厚利润。在赛季结束时,甲级中排名最后的3个俱乐部降级,进入下一赛季的乙级联赛。降级是一个惨痛的命运,值得不惜一切去避免。
1700243182
1700243183 1977年5月8日是本赛季的最后一天。甲级联赛中3个保级名额中的2个已经被确定,第三个正等待揭晓,它将从桑德兰队、布里斯托队与考文垂队中诞生。如果桑德兰队输了这场比赛,布里斯托与考文垂只要打成平手,便可以共同留在甲级联赛。但如果桑德兰赢了,布里斯托与考文垂比赛中的输家就会被降级。这两场关键比赛理论上是同时进行的。但事实上,布里斯托对考文垂的比赛刚好推迟了5分钟开始。这种情况下,桑德兰队的结果在布里斯托对考文垂的比赛结束前便为两队所知晓了。这便埋下了这个复杂故事的伏笔。
1700243184
1700243185 布里斯托与考文垂间的大部分比赛时间,用当时一份新闻报道来说,是“迅猛激烈”的,激动人心。赛前双方各自定下的2个进球的目标,在比赛80分钟时已经达到。比赛结束前2分钟时,桑德兰输了的消息迅速传了过来。考文垂的经理迅速让场边的巨大电子信息屏放出了这条消息。所有22名队员显然都看到并且意识到无须多事了,一个平局足以让双方都能逃避保级的命运。而如果试图进球会使情况更糟,这意味着把球员从防守转向进攻,将承担战败而降级的风险。我们还是引用那份新闻报道吧。“在唐·吉利斯(Don Gillies)80分钟时的进球帮助球队和布里斯托战成平手时,双方的支持者1秒钟前还是分外眼红的仇人,1秒钟后却迅速加入一场共同的狂欢庆祝中。裁判查利斯(Ron Challis)无奈地看着球员们把球传来传去,于对手完全没有任何威胁。之前的零和博弈在外界新闻的影响下迅速变成一场非零和博弈。在我们早先的讨论情况下,就好比外部的“银行家”奇迹般地出现了,使得布里斯托和考文垂从平局结果中得到好处。
1700243186
1700243187 类似足球这种观赏运动通常是零和博弈,理由是观看双方的剧烈对抗比友好比赛更为激动人心。但现实生活——无论是人类生活或者是植物、动物的生活中——并非为观众所设计。事实上,现实生活中的大部分情况都是非零和博弈,社会扮演了“银行家”的角色,个人则可以从对方的成功中获益。我们可以看到,在自私的基因的基本原理的指导下,即使在自私的人类世界里,合作与互助同样促使社会兴旺发展。我们现在可以从阿克塞尔罗德的定义出发去理解,好人确实有好报。
1700243188
1700243189 但这只能在博弈重复进行下才能发生。博弈者必须清楚这并不是他们之间最后一场博弈。用阿克塞尔罗德艰涩的用语来说,“未来的阴影”还很长。但这需要有多长?它不可以无限长。理论上说,博弈的长度并不重要,重要的是博弈双方必须都不清楚博弈结束的时间。假设你我正在进行一场博弈,我们都知道博弈的重复次数为100回合,那么我们彼此清楚,第100回合将等同于一场简单的一次性“囚徒困境”。这种情况下,最理性的决策是我们双方各自在最后一轮打出“背叛”。自然,我们也彼此能预测对方也会“背叛”,这使得最后一轮的结果毫无悬念。既已如此,第99轮则相当于一次性博弈,而双方能做出的唯一理性决策则是“背叛”。第98轮同理。在两个完全理性并假设对方同样理性的博弈者处,如果他们知道比赛的回合数,他们只能彼此不停“背叛”。于是当博弈理论家谈论“重复囚徒困境”时,他们经常假设博弈的终点不可知,或者只有“银行家”知道。
[ 上一页 ]  [ :1.70024314e+09 ]  [ 下一页 ]