1701067650
1701067651
在每一代,群体进行一次循环博弈:群体中每个个体与其他所有个体博弈一次,每当出现背叛,背叛行为都有一定概率被其他个体发现。一旦被发现,发现背叛行为的个体就会根据自身的正义度以一定概率对背叛个体进行惩罚。
1701067652
1701067653
在每次循环之后,会发生进化过程:根据适应度(得分)选择父代策略,从而产生出下一代策略。父代通过变异复制产生后代:每个后代的无耻度和嫉恶度在父代的基础上稍微变化。如果开始时群体中大多数个体的正义度都设为0(也就是没有社会规范),那背叛者就会越来越多。阿克塞尔罗德最初希望能发现促进群体中合作进化的规范——也就是说,进化出正义度以对抗无耻度。
1701067654
1701067655
然而,结果是仅仅有规范并不足以保证产生合作。在后来的实验中,阿克塞尔罗德又加入了元规范(metanorms),在其中有执法者来惩罚非执法者。不知道你们明不明白我的意思,就好像逛超市的时候,如果我没有阻止我的小孩在过道里嬉闹,还撞到了其他顾客,有些这样的人就会以鄙视的眼神看着我。这样的元规范对我很有效。阿克塞尔罗德也发现元规范很有用——如果周围有惩罚者,非惩罚者就会演化得更倾向于惩罚,而被惩罚的背叛者也会演化得更愿意合作。用阿克塞尔罗德的话说,“元规范能促进并保持群体中的合作”。 [199]
1701067656
1701067657
加入空间结构
1701067658
1701067659
数学生物学家诺瓦克(Martin Nowak)和其合作者在囚徒困境中加入了空间结构,这种扩展也非常有趣。在阿克塞尔罗德最初的实验中没有空间的概念——所有参与者相遇的可能性都一样,参与者之间的距离没有意义。
1701067660
1701067661
诺瓦克猜测,如果参与者位于空间网格上,有严格的邻居概念,则会对合作的进化产生很强的影响。诺瓦克同他的博士后导师梅一起进行了计算机仿真 [200] (在第2章讲逻辑斯蒂映射时我们已经见过梅),实验中参与者位于2维网格上,都只与最近的邻居博弈。如图14.4所示,图中有一个5×5的网格,每个格子中有一个参与者(诺瓦克和梅的网格要大得多)。所有参与者的策略都极为简单——它们没有记忆;要么一直合作,要么一直背叛。
1701067662
1701067663
1701067664
1701067665
1701067666
▲图14.4 空间囚徒困境博弈示意图。每个策略只与最近的邻居进行博弈——例如,策略P13只与其最近的邻居(阴影部分)进行博弈和生存竞争
1701067667
1701067668
模型周期运行。在每个时间步,每个策略与8个最近的邻居分别进行一次囚徒困境博弈(与元胞自动机类似,边缘上的格子回绕相连),然后将8次博弈的得分加总。接下来进行选择,每个策略都替换为邻域中得分最高的策略(有可能是它自己):没有变异。
1701067669
1701067670
这项研究的出发点是生物学。就像诺瓦克和梅说的,“我们认为,群体中确定的空间结构对合作的进化可能很重要 [201] ,无论是分子、细胞,还是生物”。
1701067671
1701067672
诺瓦克和梅用各种合作和背叛个体的初始设置以及不同的收益矩阵进行了实验。他们发现在有些条件下,合作和进化个体的空间分布模式有可能振荡,甚至产生“混沌性变化”, [202] 在其中合作者和背叛者共存。而在非空间性的多方囚徒困境博弈中,如果没有前面提到的元规范,最后背叛者会占据群体。在诺瓦克和梅加入空间后,合作者可以一直坚持下去,无需在博弈中加入规范或元规范。
1701067673
1701067674
诺瓦克和梅认为他们的结果表现了真实世界中的一个特性——即,空间相邻关系的存在会促进合作。在评论这项研究时,生物学家西格蒙德(Karl Sigmund)这样说道:“地域性有利于合作 [203] ……这在真实的社区中可能也是成立的。”
1701067675
1701067677
建模的好处
1701067678
1701067679
对于囚徒困境这样的理想模型的计算机仿真,如果做得好的话,会是实验科学和数学理论的有力补充。对于大部分复杂系统来说,不可能对其进行真正的实验,用数学研究也非常困难,这个时候模型就是研究它们的唯一可行途径。像囚徒困境这样的理想模型最大的贡献就是为我们提供了一把钥匙,来研究合作的进化这类没有精确的科学术语和完善定义的现象。
1701067680
1701067681
囚徒困境模型具备了前面列出的科学中理想模型的所有作用(其他复杂系统模型也可以列出类似的贡献):
1701067682
1701067683
证明了解释某种现象的机制是不是合理。例如,霍布斯可能不会相信,在自私但具有适应性的个体组成的缺乏领袖的群体中会产生合作,而各种各样的囚徒困境模型则证明了这一点(虽然是以某种理想形式)。
1701067684
1701067685
研究简单模型在改变后的效应,引导对复杂现象的认识。各种各样的囚徒困境变体揭示了合作得以产生的条件。比如说,你可能会问,如果本来想合作的人犯了错,不小心发出了不合作的信号,打个比方,美国总统的意见被翻译成俄语时不小心弄错了,会发生什么呢?囚徒困境模型为研究这类讯息错误的影响提供了条件。霍兰德曾把这种模型比作“飞行模拟器” [204] ,可以用来验证人们的思想和改进人们的认识。
1701067686
1701067687
为新技术带来灵感。囚徒困境的研究结果——例如,合作得以产生和维持的条件——就被用来帮助改进P2P网络 [205] 和在电子商务中防止欺诈 [206] ,类似的应用还有很多。
1701067688
1701067689
引出数学理论。一些人利用囚徒困境的计算机仿真结果研究合作产生条件的通用数学理论。最近的一个例子就是诺瓦克在题为《合作进化的5条规则》的文章中所做的工作。 [207]
1701067690
1701067691
从囚徒困境这样的理想模型中得出的结论能否用于改进政府外交策略或全球变暖等问题的政策决策呢?用理想模型研究各种政策效果的想法很有吸引力,事实上,囚徒困境及其相关模型对政策分析的影响已经很大了。
1701067692
1701067693
举个例子,新能源金融(New Energy Finance)是专为全球变暖问题提供咨询的公司,这家公司最近公布了一份报告, [208] 题为《如何拯救地球:友善、报复、宽恕、明确》。报告中认为气候变化问题就是多方多回合的囚徒困境问题,各个国家可以选择合作(减少碳排放,代价是经济受损)或是不合作(什么也不做,目前来看省了钱)。这个博弈会反复进行,不断缔结新的规范碳排放的协议和公约。报告认为,各国政府和国际组织的政策应当采取“友善、报复、宽恕、明确”的原则,正是阿克塞尔罗德在重复囚徒困境中指出的成功所需的条件。
1701067694
1701067695
另外,前面介绍了,通过研究规范和元规范的模型,发现规范和元规范对维持合作都很重要。这个结果对政府制定应对恐怖主义、军备控制和环境治理等问题的政策也有影响。 [209] 诺瓦克和梅的空间囚徒困境模型则告诉人们,在许多问题中——无论是生物多样性的维持和细菌制造新抗生素的效率问题 [210] ——空间和位置对于促进合作起到的作用。
1701067696
1701067698
计算机建模注意事项
1701067699
[
上一页 ]
[ :1.70106765e+09 ]
[
下一页 ]