打字猴:1.704423857e+09

1704423857 演化与博弈论 [:1704421370]

1704423858 演化与博弈论第十三章　合作的演化

1704423859

1704423860 动物之间合作的演化问题，无论是种内的还是种间的，都是达尔文主义者必须面对的重要问题。达尔文自己也意识到这一点。他认为动物的社会行为，正如群居型昆虫所表现的那样，可以用家庭选择来解释。他也注意到如果可以找到一种物种生存的某种特性完全是为了保证另一种物种的生存，那么他的理论可以被证明是错误的。含蓄地说，物种间互惠共生的现象必须通过实施合作行为的个体获得的间接受益来解释。

1704423861

1704423862 尽管存在这些本质上正确的理解，但是在《物种起源》发表的100年之后，对引起合作行为演化的自然选择力的分析依然停滞不前。对许多生物学家而言，可以找到一个有利于物种生存，甚或是有利于生态系统生存的遗传特征已经足够令他满意了。从J. B. S. Haldane和R. A. Fisher的著述中我们可以很清楚地看到他们对这一点有更深的认识。然而，Hamilton（1964）转向了对在社会行为中亲属关系的重要性的研究，这具有决定性意义。或许不可避免的是，综合适应度这一优雅的思想以及社会性群体成员之间遗传关系的流行会导致注意力从其他自然选择力量上转移开，并且特别会忽视互惠共生效应，那就是说，会忽视两个（或更多的）个体会因为合作对双方都有好处而采取合作的行为这个事实。但是，互惠共生效应并没有被学者所忽视（例如，Michener，1974；West-Eberhard，1975），并且Trivers（1971）指出延迟的相互报答行为的可能性。

1704423863

1704423864 今天，我们很明显地看到社会性行为的演化问题不但包含了动物亲属之间的互动行为还包含了合作的个体间相互的利益。在这一章中，我想从另一个角度来处理这个问题，尽管得到的结论将是相似的。我将从描述Axelrod（1981）关于在囚徒困境博弈中的合作演化问题的著作开始。然后，沿着Axelrod和Hamilton（1981）的思路，讨论Axelrod的想法可能和动物的演化行为是相关的。最后，再回到人类合作行为的问题上来，并且讨论演化博弈论和文化演化之间可能的相关性。

1704423865

1704423866 囚徒困境是一个对称的两人博弈，在这个博弈中，可选择的策略是“合作”和“背叛”。博弈的支付矩阵如表28所示，见第169页。注意到如果局中人B选择合作，那么局中人A选择背叛将是有利可图的，并且如果局中人B选择背叛，那么局中人A还是应该选择背叛。那就是说，无论局中人B采取什么样的策略，局中人A选择背叛总是有利可图的。类似地，无论局中人A采取什么样的策略，局中人B也都会选择背叛。然而，如果他们都选择背叛，那么相比两者合作的情形将要更糟糕，这就是悖论之所在。

1704423867

1704423868 在一个演化的情形中考虑，如果每一个参与者都只和对手进行一次博弈，那么唯一的ESS就是背叛策略。合作的行为不可能演化得到。然而，一个参与者如果与同样的对手进行重复的博弈，那么情况就会不同。Axelrod研究的便是这一种情形。他邀请许多人通过计算机程序与同一个对手重复进行囚徒困境的博弈，接着他在递交的程序结果中进行一场锦标赛，每一个程序的结果都进行了200次囚徒困境的博弈，然后程序的结果将根据累计的总回报进行排序（应该注意的是，这并不是根据在个体间的竞赛中对手失败的次数来排序的）。取得胜利的那个程序结果是由Anatol Rapoport递交的，所采取的策略也是最简单的。那就是“以牙还牙（TIT FOR TAT）”。在第一步行动中采取合作策略，但在后继的所有行动中，都选择对手前一步所采取过的策略。

1704423869

1704423870 他把这个锦标赛的结果公之于众，并且要求人们进行第二次锦标赛并递交结果。这一次锦标赛除了每个人博弈的次数不是正好200次之外，在形式上与第一次是完全相同的，每人博弈的次数是随机的，但以200次为其中位数值。这样就解决了对最后一场博弈可能有特殊行为规则的难题。“以牙还牙”的策略者再度获胜。进一步的计算机分析表明如果接连进行一系列的博弈锦标赛，如果程序运行良好则其代表性不断增加，那么“以牙还牙”的策略安排最终将取代其他所有策略。那就是说，对于递交的博弈程序结果，“以牙还牙”策略是一个ESS。

1704423871

1704423872 是什么性质使得“以牙还牙”成为博弈的ESS的呢？Axelrod认为一个成功的策略必具备“优美性”、“惩罚性”和“宽容性”。一个令人愉快的策略安排从不首先选择背叛。在两个采取正派策略的对手之间的博弈中，两个对手都能取得很好的成绩。一个惩罚性的策略是对对手采取的背叛行为立刻也以背叛行为做出回应。一个不以这种方式立刻回应对手的策略安排会鼓励对手背叛自己。一个宽容性的策略是这样一个策略，当对手采取合作策略时，自己也迅速地回到合作的状态下。采取不具宽容性的策略很有可能陷入一场双方都采取背叛的拖延的博弈中。

1704423873

1704423874 Axelrod之后证明了“以牙还牙”策略是稳定的，能够防止任何其他可能策略的侵害，倘若面对每一个对手博弈的序列足够长时。他的证明被总结在附录十一中。但是，“以牙还牙”策略并不是唯一的ESS，因为“总是背叛”也是一个ESS。对策略TFT（以牙还牙）和策略D（总是背叛）进行比较表明前者更具吸引力。这样我们假设个体主要是与其邻居进行博弈，并且总是存在一类具有相似策略的个体聚合。于是我们就可以得到TFT策略，即使当其非常罕见时，也能够侵害D策略，这是因为TFT策略者与采取同样策略的邻居博弈时会取得更高的回报，聚类效应并不会使D策略侵害TFT策略。这就阐释了下列事实：一个遗传特性最初的扩展经常需要亲缘选择，一旦这个特性得到普及，那么它就可以只通过互惠效应维持下去。

1704423875

1704423876 上述这些结果为合作行为的演化提供了一个模型。一眼看去，似乎这个模型只和比较高等的动物相关，这样的动物才能将其面对的各种对手分辨开来。如果这样的判断能力不存在，一个遇到采取背叛策略的对手的局中人会在与他人的博弈中也采取背叛的态度，并且博弈的结果马上变成都采取背叛策略。然而，Axelrod和Hamilton（1981）指出，如果每一个对手在其一生中只面对一个对手，那么这个模型仍然可以应用。如果满足这一附带条件，那么“以牙还牙”策略在完全没有鉴别力的生物群体中演化为一个可行的策略。他们还指出，这个模型也可以用于不同物种成员之间的互动行为。

1704423877

1704423878 如果种内或种间的合作行为是通过这种途径演化得到，那么必须具备三个条件：

1704423879

1704423880 （1）在同一对对手之间（或者，可能是两个无性生殖的有机物或者两个同系交配的群体之间）必须具有重复的互动行为；

1704423881

1704423882 （2）每一个局中人必须对对手的背叛采取报复的行为；

1704423883

1704423884 （3）个体识别（individual recongnition）必须是可能的，或者与一个个体进行博弈的潜在对手数量必须很小，最好只有一个。

1704423885

1704423886 Axelrod和Hamilton从这个角度出发讨论了许多不同的合作及其破裂的例子。首先，互利主义的很多例子包含了在一个物种中的一个成员和另一个物种中的一个成员之间的互动行为，比如海葵和寄居蟹之间的博弈，树和菌根真菌之间的博弈。有时候，由于互动行为发生于一个特定的地点，这个约束有效地限制了参与博弈的对手数量，比如Triver（1971）讨论的关于清道鱼（cleaning fish）的例子。

1704423887

1704423888 D. S. Wilson（1980，数学上的推导可见Slatkin和Wilson，1979）使用“间接效应”这个术语讨论了在两个同系交配的群体之间，而不是在两个个体之间，演化导致合作行为的可能性。虽然他没有明确地涉及同系交配问题，但是很显然他所思考的机制要求在代际之间具有很高的群体粘性。举例来说，Axelrod和Hamilton指出蚂蚁群体具有很多共生现象，而在以较频繁地在不同的地点之间移动的蜜蜂中，具有很多寄生虫，但是没有已知的共生现象。

1704423889

1704423890 在较高等的生物体中，合作的行为可能取决于个体识别。或许最清晰的例子是Packer（1977b）在缺乏任何已知的互动行为间遗传关系的情况下，对成对的雄性橄榄狒狒之间互惠利他主义的实证研究。正如在本书上171—172页讨论的那样，可以很容易地把这种类型的互惠利他主义建成一个博弈的模型，并且以“以牙还牙”策略为其ESS。

1704423891

1704423892 将这些思想应用到狒狒的行为中去，当然更不必说应用于人类的行为，就会产生关于作为演化过程基础的“世袭”机制的本质——遗传的或是文化的——的问题。这样，合作行为是一个稳定的结果这个结论必须建立在个体在某种意义上能够成功地把更多的个性传递给其“后裔”而不是他人这个假设之上。下列三种“世袭”机制是可能的：

1704423893

1704423894 （1）遗传。假设采取不同策略的个体间的差异至少有一部分是遗传的：即是由于从其发育而来的受精卵之间的差异导致的。我认为，重要的是诸如“遗传决定”或者“先天的”这样的术语应该在严格的意义下使用。在生物社会学的讨论中绝不会总是这样的情况。举例说来，E. O. Wilson（1978）在写关于进攻性行为的一章时是这样开始的：“人类天生具有进攻性吗？这是一个在大学学术讨论会和鸡尾酒派对的交谈中令人感兴趣的话题，并且是一个能够激起各种政治意识形态情绪的问题。问题的答案是肯定的”。而在阅读这章余下的内容时，结果发现Wilson所辩护的唯一性质乃是人类在某些时候是具有进攻性的。

1704423895

1704423896 在Parker讨论的狒狒的例子中，似乎互惠的利他行为不仅仅是通过对遗传差异的选择行为来维持的。某种程度的模仿，或许还有洞察力学习（insight learning，即对不作出互惠行为的成本计算），都有可能包含在内。在人类中，这样的过程有可能占据主导的地位。不过，遗传演化可能会使狒狒和人类比其他物种更乐意去学习某些东西。

1704423897

1704423898 （2）学习。在第五章中，已经表明一个一般性的学习法则，其并不是任何具体的博弈所特有的，能够在一个世代的时间里把种群引致ESS状态。但是这样的一个学习法则在这里派不上什么用处。所讨论过的学习规则的类型具有一个可选择的“行为”的集合作为起点。在一个重复的囚徒困境博弈情境中，这就要求一个个体应以一个可选择的“行为”的集合作为起点，在这个集合中包含了“以牙还牙”策略，在不同场合与采取不同策略的对手进行了一系列长时间的博弈，并且他将逐渐根据博弈结局来调整选择不同策略的频率。一个个体一生的时间对于这样一个非效率的学习过程可能不是足够长的。

1704423899

1704423900 对于人类而言，我们可以考虑关于洞察力学习另一种可能性。一个人可以设想一系列的博弈，并在博弈中采取不同的策略，从而计算出“以牙还牙”策略是最优的。这似乎也是难以置信的，参与Axelrod的博弈锦标赛的科学家们显然不能够完成这样的计算任务。

1704423901

1704423902 然而，一旦“以牙还牙”的行为建立起来，那么学习对于维持这种局面显得尤为重要。如果几乎每一个个体都采取“以牙还牙”的策略，那么一个采取任何其他策略的个体都将是无利可图的。这一点可以通过试验学习很快得到，无论是通过头脑的想象还是实践的经验。

1704423903

1704423904 （3）文化遗传。考虑一个过于简化的模型，其中个体的行为是通过学习或者模仿他人而取得的，并且他们总是更倾向于从成功的良师益友中复制行为。这样一个文化遗传的过程将导致行为模式的传播，包括满足演化稳定性判断标准的合作行为。Feldman和Cavalli-Sforza（1976）以及Lumsden和wilson（1981）极为深入地分析了这样的一个文化遗传过程以及它们与基因遗传过程的互动情况。这里我唯一的目的是提出这样一个问题：在导致演化稳定状态的意义下，哪种类型的文化遗传在形式上与无性遗传相类似。

1704423905

1704423906 实际上，我更感兴趣的是提出上述问题而非将其解决。博弈论的思想起源于社会学。追本溯源，所发展的解的概念是基于理性计算的思想。演化生物学家借用了这种思想，他们基于在种群中运作的自然选择和遗传现象引入了一个新的解的概念。如果现在把演化稳定性的思想再次引入到社会学中，那么至关紧要的是，只有当一个适合的文化遗传机制存在的时候这个任务才能得以完成。

[ 上一页 ] [ :1.704423857e+09 ] [ 下一页 ]