打字猴:1.704423867e+09

1704423867

1704423868 在一个演化的情形中考虑，如果每一个参与者都只和对手进行一次博弈，那么唯一的ESS就是背叛策略。合作的行为不可能演化得到。然而，一个参与者如果与同样的对手进行重复的博弈，那么情况就会不同。Axelrod研究的便是这一种情形。他邀请许多人通过计算机程序与同一个对手重复进行囚徒困境的博弈，接着他在递交的程序结果中进行一场锦标赛，每一个程序的结果都进行了200次囚徒困境的博弈，然后程序的结果将根据累计的总回报进行排序（应该注意的是，这并不是根据在个体间的竞赛中对手失败的次数来排序的）。取得胜利的那个程序结果是由Anatol Rapoport递交的，所采取的策略也是最简单的。那就是“以牙还牙（TIT FOR TAT）”。在第一步行动中采取合作策略，但在后继的所有行动中，都选择对手前一步所采取过的策略。

1704423869

1704423870 他把这个锦标赛的结果公之于众，并且要求人们进行第二次锦标赛并递交结果。这一次锦标赛除了每个人博弈的次数不是正好200次之外，在形式上与第一次是完全相同的，每人博弈的次数是随机的，但以200次为其中位数值。这样就解决了对最后一场博弈可能有特殊行为规则的难题。“以牙还牙”的策略者再度获胜。进一步的计算机分析表明如果接连进行一系列的博弈锦标赛，如果程序运行良好则其代表性不断增加，那么“以牙还牙”的策略安排最终将取代其他所有策略。那就是说，对于递交的博弈程序结果，“以牙还牙”策略是一个ESS。

1704423871

1704423872 是什么性质使得“以牙还牙”成为博弈的ESS的呢？Axelrod认为一个成功的策略必具备“优美性”、“惩罚性”和“宽容性”。一个令人愉快的策略安排从不首先选择背叛。在两个采取正派策略的对手之间的博弈中，两个对手都能取得很好的成绩。一个惩罚性的策略是对对手采取的背叛行为立刻也以背叛行为做出回应。一个不以这种方式立刻回应对手的策略安排会鼓励对手背叛自己。一个宽容性的策略是这样一个策略，当对手采取合作策略时，自己也迅速地回到合作的状态下。采取不具宽容性的策略很有可能陷入一场双方都采取背叛的拖延的博弈中。

1704423873

1704423874 Axelrod之后证明了“以牙还牙”策略是稳定的，能够防止任何其他可能策略的侵害，倘若面对每一个对手博弈的序列足够长时。他的证明被总结在附录十一中。但是，“以牙还牙”策略并不是唯一的ESS，因为“总是背叛”也是一个ESS。对策略TFT（以牙还牙）和策略D（总是背叛）进行比较表明前者更具吸引力。这样我们假设个体主要是与其邻居进行博弈，并且总是存在一类具有相似策略的个体聚合。于是我们就可以得到TFT策略，即使当其非常罕见时，也能够侵害D策略，这是因为TFT策略者与采取同样策略的邻居博弈时会取得更高的回报，聚类效应并不会使D策略侵害TFT策略。这就阐释了下列事实：一个遗传特性最初的扩展经常需要亲缘选择，一旦这个特性得到普及，那么它就可以只通过互惠效应维持下去。

1704423875

1704423876 上述这些结果为合作行为的演化提供了一个模型。一眼看去，似乎这个模型只和比较高等的动物相关，这样的动物才能将其面对的各种对手分辨开来。如果这样的判断能力不存在，一个遇到采取背叛策略的对手的局中人会在与他人的博弈中也采取背叛的态度，并且博弈的结果马上变成都采取背叛策略。然而，Axelrod和Hamilton（1981）指出，如果每一个对手在其一生中只面对一个对手，那么这个模型仍然可以应用。如果满足这一附带条件，那么“以牙还牙”策略在完全没有鉴别力的生物群体中演化为一个可行的策略。他们还指出，这个模型也可以用于不同物种成员之间的互动行为。

1704423877

1704423878 如果种内或种间的合作行为是通过这种途径演化得到，那么必须具备三个条件：

1704423879

1704423880 （1）在同一对对手之间（或者，可能是两个无性生殖的有机物或者两个同系交配的群体之间）必须具有重复的互动行为；

1704423881

1704423882 （2）每一个局中人必须对对手的背叛采取报复的行为；

1704423883

1704423884 （3）个体识别（individual recongnition）必须是可能的，或者与一个个体进行博弈的潜在对手数量必须很小，最好只有一个。

1704423885

1704423886 Axelrod和Hamilton从这个角度出发讨论了许多不同的合作及其破裂的例子。首先，互利主义的很多例子包含了在一个物种中的一个成员和另一个物种中的一个成员之间的互动行为，比如海葵和寄居蟹之间的博弈，树和菌根真菌之间的博弈。有时候，由于互动行为发生于一个特定的地点，这个约束有效地限制了参与博弈的对手数量，比如Triver（1971）讨论的关于清道鱼（cleaning fish）的例子。

1704423887

1704423888 D. S. Wilson（1980，数学上的推导可见Slatkin和Wilson，1979）使用“间接效应”这个术语讨论了在两个同系交配的群体之间，而不是在两个个体之间，演化导致合作行为的可能性。虽然他没有明确地涉及同系交配问题，但是很显然他所思考的机制要求在代际之间具有很高的群体粘性。举例来说，Axelrod和Hamilton指出蚂蚁群体具有很多共生现象，而在以较频繁地在不同的地点之间移动的蜜蜂中，具有很多寄生虫，但是没有已知的共生现象。

1704423889

1704423890 在较高等的生物体中，合作的行为可能取决于个体识别。或许最清晰的例子是Packer（1977b）在缺乏任何已知的互动行为间遗传关系的情况下，对成对的雄性橄榄狒狒之间互惠利他主义的实证研究。正如在本书上171—172页讨论的那样，可以很容易地把这种类型的互惠利他主义建成一个博弈的模型，并且以“以牙还牙”策略为其ESS。

1704423891

1704423892 将这些思想应用到狒狒的行为中去，当然更不必说应用于人类的行为，就会产生关于作为演化过程基础的“世袭”机制的本质——遗传的或是文化的——的问题。这样，合作行为是一个稳定的结果这个结论必须建立在个体在某种意义上能够成功地把更多的个性传递给其“后裔”而不是他人这个假设之上。下列三种“世袭”机制是可能的：

1704423893

1704423894 （1）遗传。假设采取不同策略的个体间的差异至少有一部分是遗传的：即是由于从其发育而来的受精卵之间的差异导致的。我认为，重要的是诸如“遗传决定”或者“先天的”这样的术语应该在严格的意义下使用。在生物社会学的讨论中绝不会总是这样的情况。举例说来，E. O. Wilson（1978）在写关于进攻性行为的一章时是这样开始的：“人类天生具有进攻性吗？这是一个在大学学术讨论会和鸡尾酒派对的交谈中令人感兴趣的话题，并且是一个能够激起各种政治意识形态情绪的问题。问题的答案是肯定的”。而在阅读这章余下的内容时，结果发现Wilson所辩护的唯一性质乃是人类在某些时候是具有进攻性的。

1704423895

1704423896 在Parker讨论的狒狒的例子中，似乎互惠的利他行为不仅仅是通过对遗传差异的选择行为来维持的。某种程度的模仿，或许还有洞察力学习（insight learning，即对不作出互惠行为的成本计算），都有可能包含在内。在人类中，这样的过程有可能占据主导的地位。不过，遗传演化可能会使狒狒和人类比其他物种更乐意去学习某些东西。

1704423897

1704423898 （2）学习。在第五章中，已经表明一个一般性的学习法则，其并不是任何具体的博弈所特有的，能够在一个世代的时间里把种群引致ESS状态。但是这样的一个学习法则在这里派不上什么用处。所讨论过的学习规则的类型具有一个可选择的“行为”的集合作为起点。在一个重复的囚徒困境博弈情境中，这就要求一个个体应以一个可选择的“行为”的集合作为起点，在这个集合中包含了“以牙还牙”策略，在不同场合与采取不同策略的对手进行了一系列长时间的博弈，并且他将逐渐根据博弈结局来调整选择不同策略的频率。一个个体一生的时间对于这样一个非效率的学习过程可能不是足够长的。

1704423899

1704423900 对于人类而言，我们可以考虑关于洞察力学习另一种可能性。一个人可以设想一系列的博弈，并在博弈中采取不同的策略，从而计算出“以牙还牙”策略是最优的。这似乎也是难以置信的，参与Axelrod的博弈锦标赛的科学家们显然不能够完成这样的计算任务。

1704423901

1704423902 然而，一旦“以牙还牙”的行为建立起来，那么学习对于维持这种局面显得尤为重要。如果几乎每一个个体都采取“以牙还牙”的策略，那么一个采取任何其他策略的个体都将是无利可图的。这一点可以通过试验学习很快得到，无论是通过头脑的想象还是实践的经验。

1704423903

1704423904 （3）文化遗传。考虑一个过于简化的模型，其中个体的行为是通过学习或者模仿他人而取得的，并且他们总是更倾向于从成功的良师益友中复制行为。这样一个文化遗传的过程将导致行为模式的传播，包括满足演化稳定性判断标准的合作行为。Feldman和Cavalli-Sforza（1976）以及Lumsden和wilson（1981）极为深入地分析了这样的一个文化遗传过程以及它们与基因遗传过程的互动情况。这里我唯一的目的是提出这样一个问题：在导致演化稳定状态的意义下，哪种类型的文化遗传在形式上与无性遗传相类似。

1704423905

1704423906 实际上，我更感兴趣的是提出上述问题而非将其解决。博弈论的思想起源于社会学。追本溯源，所发展的解的概念是基于理性计算的思想。演化生物学家借用了这种思想，他们基于在种群中运作的自然选择和遗传现象引入了一个新的解的概念。如果现在把演化稳定性的思想再次引入到社会学中，那么至关紧要的是，只有当一个适合的文化遗传机制存在的时候这个任务才能得以完成。

1704423907

1704423908 有可能的是，文化的过程将会经常模仿遗传的过程，但是对不同类型的文化演化中存在的差异需要进行区别。首先，考虑这样一个情形，其中所有的孩子都通过模仿获得其母亲的一些特性，并且母亲将她们自己获得的特性传递下去。在这样的特性演化的过程中，“适应度”将通过母亲的达尔文适应度来衡量，那些特性会不断增加，并且能够帮助它们的拥有者生存以及生产更多的子女。在相反的极端状态下，假设每一个子女通过模仿某个导师（mentor）来获得某种特性，这个导师并非其父母，但是通过一些标准他们被认为是“成功的”。以此来衡量，则一些保证成功的特性将不断增多。由于成功的判断标准本身在一定程度上是文化决定的，这包含了一个更为复杂但或许更为现实的过程。

1704423909

1704423910 到目前为止，似乎行为的特征都是个体的属性，而且似乎个体获得一种行为就会实行终身，但是这些都不是真实的。个体很可能改变他们的行为，并且横向的传递和纵向的传递都有可能发生。一些习俗和惯例可能是机构——企业、学校和政府等的属性，并且至少有些这样的机构的发展是受这些惯例决定的。

1704423911

1704423912 总而言之，至少存在一种博弈，人可以参与，但似乎超越了动物的能力。这就是“社会契约”博弈。这样，假设某种行为模式——比如盗窃——看上去是令人不快的。一群能够用符号进行交流的个体可以达成不偷盗的协议，并且对任何一个在群体中的确具有偷盗行为的个体实施惩罚。那样，依靠群体自身还不足以保证稳定性，因为执行惩罚的成本很可能是高昂的，因此个体只是有兴趣接受契约带来的好处，但不愿意接受执行契约带来的成本。稳定性要求一个拒绝参与执行契约的个体应该被看成是对契约的破坏，也应该接受惩罚。到后一阶段，契约的执行被委托给一个子群体，这个子群体通过执行契约而受到奖赏。

1704423913

1704423914

1704423915

1704423916

[ 上一页 ] [ :1.704423867e+09 ] [ 下一页 ]