打字猴:1.70102872e+09

1701028720 合作的进化（修订版） [:1701027612]

1701028721 第八章合作的社会结构

1701028722

1701028723 在考虑如何才能开始合作的进化时，一些社会结构被发现是必要的，特别是第三章说明了，一个总是背叛的“小人”群体不会被单个采用如“一报还一报”的善良策略的个体侵入。但是如果入侵者有一个甚至很小量的社会结构，事情就不一样了。如果他们以一个小群体出现，使得他们有一个很小的百分比与自己小群体中的其他成员相互作用。那么，他们就能侵入“小人”的群体。

1701028724

1701028725 这一章探讨社会结构的附加形式，讨论四个能够引起有趣的社会结构形式的因素：标记、信誉、管理和领地。标记是一个人的固定特征，如能被对方观察到的性别和肤色。它能引起成见和地位层次的稳定形式。一个人的信誉是可塑的，当另一个人知道他在与其他人对局时所采用的策略时，他的信誉就产生了。信誉会带来各种现象，包括激励人们去建立恶棍的声誉和激励人们去阻止他人成为恶棍。管理是统治者与被统治者之间的一种关系。政府不能只靠威胁来统治，而必须使大多数被统治者自愿服从。因此，管理只是统治的严厉性和实施过程的问题。最后，当人们只和邻居而不是与所有其他人打交道时，领地问题就出现了。当策略在群体中传播开来时，出现了非常有趣的行为模式。

1701028726

1701028727 标记，成见，地位等级

1701028728

1701028729 人们相处的方式经常受到一些可观察的特征——如性别、年龄、肤色和穿着风格——的影响。这些特征使人们在和陌生人打交道时期望陌生人的行为会像其他具有相同可观察特征的人的行为一样。因此，从理论上讲，这些特征使得一个人即使在双方打交道之前就能知道一些有关对方策略的有用信息。这是因为人们通过这些可观察到的特征将对方列为具有相同特征的群体中的一员，进而得到关于这个人将如何行为的推断。

1701028730

1701028731 与某一标记相关的期望不需要从直接的个人经历中形成。它可以通过传媒从第二手经验来获得。对这些特征的解释甚至可以通过遗传和自然选择来形成。例如，海龟能够辨认另一个海龟的性别并据此作出反应。

1701028732

1701028733 一个标记可以定义为一个对策者的固定特征。这个特征在相互作用开始时能够被对方观察到。[1]当有标记时，一个策略所做的选择不仅基于至今为止的相互作用的历史，而且还取决于对方的标记。

1701028734

1701028735 标记的一个很有趣但又令人担忧的后果是，它们能引起自我确认的成见。为了了解这是怎么发生的，我们假设每一个人不是具有蓝标记就是具有绿标记。再假设两个群体对自己群体中的成员是善良的，而对另一个群体的成员是刻薄的。具体地，可以假设两个群体的成员对自己群体成员之间采用的是“一报还一报”，而对另一群体的成员采用的是“总是背叛”。并且假设折扣系数w足够大，使得“一报还一报”是集体稳定的（依据第三章命题2）。那么，一个单一的个体，不管他是蓝还是绿的标记，只能是按照其他人的做法去做，即对自己同类善良而对其他刻薄。

1701028736

1701028737 这种激励意味着成见的稳定，甚至当成见毫无客观依据时也是这样。蓝的认为绿的是“小人”，每当他们遇上一个绿的，他们的信念就得到证实。而绿的认为只有其他绿的会回报合作，他们的信念也得到证实。如果你试图打破这个观念，你将发现你的收益值下降，并且你的希望将破灭。所以如果你和人家不一样，迟早，你要回到你所被期望的角色上来。如果你的标记说你是绿的，其他人就会把你当作绿的对待。并且由于如果你像绿的那样去行动你就会得到好处，所以你将确认其他人的期望。

1701028738

1701028739 这种成见有两个不幸的结局：一个是明显的，另一个是微妙的。明显的结果是每一个人都做得比可能的糟，因为群体之间的双方合作能提高每一个人的得分。微妙的结果来自蓝的和绿的群体在数量上的差别，即一个数量多，一个数量少。在这种情况下，在两个群体同时受到缺乏双边合作的损害时，少数群体的成员损害更大，所以少数群体经常寻求防卫性的孤立行为就不足为奇了。

1701028740

1701028741 为了解释原因，假设有80个绿的和20个蓝的在一个小镇上。每周每人相互接触一次，对于绿的来说，他们的大部分接触是发生在他们自己群体内部的，因而得到双方的合作。但是对于蓝的，他们的大部分接触是与另一个群体（绿的）发生的，因此得到的是双方背叛，这样占少数的蓝的平均得分就少于占多数的绿的平均得分。甚至当每个群体都倾向于同类交往时，情况也会如此。因为占少数的蓝与占多数的绿相遇的次数在少数者总的相遇次数中占的比例比在多数者总的相遇次数中占的比例要大（Rytina and Morgan 1982）。结论是标记支持了使每一个人受害的成见。而少数人的群体会比其他人受更大的损害。

1701028742

1701028743 标记也会造成另一个结果，即它支持了地位等级。例如，假设每个人有一些特征，如身高、力量或皮肤光泽，这是可以观察和比较的特征。为了简单起见，假设不存在相同的值。这样，当两个人相遇时，哪个有较多的特征，哪个有较少的特征就很清楚。现在假设每一个人都欺侮那些在他之下的人，而对在他之上的人则是逆来顺受。现在的问题是，这种情况能稳定吗？

1701028744

1701028745 答案是肯定的，让我们举例来说明这个问题。假设当一个人遇到在他之下的人时采用的策略是交替地使用背叛和合作，而当对方一旦背叛一次，他就不再合作，这是很霸道的。因为他可以背叛别人但决不容忍别人背叛他。再假设一个人遇见在他之上的人的策略是合作，而当对方连续两次不合作时，就永远不再合作。这是软弱的，因为他可以容忍受到交替的背叛，但他也是可激怒的，因为他不能容忍太被占便宜。

1701028746

1701028747 这个行为模式建立了基于可观察的特征的地位等级。接近顶层的人做得不错，因为他们对几乎所有的人都称王称霸。相反，接近底层的人就做得很差，因为他们要对几乎所有的人都逆来顺受。显而易见，这就是为什么接近顶层的人满足于这种社会结构。但是接近于底层的人能单独改变这种社会结构吗？

1701028748

1701028749 确实没有可能，因为在折扣系数足够大的时候，从欺侮你的人那里每两步得到一步安慰，总比背叛后面临无休止的惩罚要好。[2]因此处于社会结构底层的人是陷入困境的。他或她做得很差，但试图要反抗这个系统则会更糟。

1701028750

1701028751 在对方策略不变的情况下，孤立无援的反抗是无益的。低层的反抗将最终伤害双方。如果较高层在某种压力下可能改变他们的行为，那么低层的人在打算反抗时就应考虑到这一点。但是，这种考虑会使得较高层的人关心自己信誉的坚定性。为了研究这类现象，人们需要探讨信誉的形成。

1701028752

1701028753 信誉和威慑

1701028754

1701028755 一个人的信誉体现在其他人对他将采用的策略的信心上。信誉是通过观察这个人与其他人的相互作用时的行为来建立的。例如，英国的可激怒的信誉是通过它反击阿根廷的入侵收回福克兰群岛而建立的。其他国家能够看到英国的行为，并据此推断它会如何对他们自己在将来的行为作出反应。特别相关的是，西班牙关于英国对直布罗陀所承担的义务的推理和中国关于英国对香港承担的义务的推理。这些推理是否正确是另一码事。重要的是当第三者在观察时，当前选择的利害关系从当时的直接结果扩展到了对当事人的信誉的影响。

1701028756

1701028757 知道某些人的信誉能使你在作出第一次选择之前就能知道一些关于他们采用的策略的情况。这个可能性带来了一个问题，即确切知道对方所采用的策略有多大价值。衡量任何一个信息的价值的方法是计算在你有这个信息时所做的比没有这个信息时好多少（Raiffa 1968）。因此，没有这个信息时，你做得越好，你对信息的需求就越少，那么这个信息就越不值钱。例如在两轮“囚徒困境”的竞赛中，“一报还一报”在不知道对方所采用的策略的情况下就做得很好。知道对手的策略只有在很少的情况下能使一个人做得更好。例如，如果已经知道对方的策略是“两报还一报”（即只有在对手在前两步连续背叛时它才背叛），那么你采用背叛与合作交替的策略就可能比采用“一报还一报”要好。但是在两轮竞赛中没有多少可剥削的策略。所以提前知道对方的策略也不能帮助你干得比“一报还一报”策略好。事实上，从知道对方策略中得到的好处很少，这正说明了“一报还一报”策略的鲁棒性。

1701028758

1701028759 关于信息的价值问题可以反过来讲：让其他人知道你的策略的价值（或代价）是什么。当然，答案取决于你所采用的策略。如果你采用的是可剥削的策略如“两报还一报”，那么代价是很大的。另一方面，如果你采用的是最好与它完全合作的策略，那么你可能很愿意让人家知道你的策略。例如，如果你使用“一报还一报”，那么你会很愿意让对方知道这一点，并且适应它。当然未来的影响必须足够大使得最好的反应是采用善良策略。事实上，如前面说过的，“一报还一报”的优点在于它在游戏的过程中容易被识别，即使采用它的人还没有建立起信誉。

1701028760

1701028761 对一个人来说，有一个牢固的采用“一报还一报”的信誉是很有好处的。但这确实不是一个最好的信誉，最好的信誉是恶棍的声誉。最好的一种恶棍是具有尽可能压榨对方又不容忍对方有任何背叛的信誉的恶棍。尽可能压榨对方的方法是频繁地背叛，恰好使得对方总是合作比总是背叛只好一点点。鼓励对方合作的最好方式是让大家知道如果对方一旦背叛，你就决不会再合作。

1701028762

1701028763 幸运的是，建立恶棍的信誉是不容易的。要让人家知道你是恶棍，你就必须经常背叛，这就意味着你很可能激怒对方来报复你。到了你完全建立信誉时，你很可能已经陷入许多毫无益处的毅力较量中去了。例如，对方即使只背叛一次，你也会在是按要建立的信誉所要求的那样去做，还是在当前接触中力图恢复友好关系之间左右为难。

1701028764

1701028765 当对方也试图建立他的信誉时，情况就更坏，因为他将不会宽恕你用来试图建立你的信誉的背叛。当双方都试图建立自己的信誉以便用来对付未来对策中的其他人时，他们就很容易卷入一连串的相互惩罚之中。

1701028766

1701028767 双方都有意假装没有注意到对方在试图干什么。双方都想显得是不可训练的以便使对方自愿停止欺负自己。

1701028768

1701028769 “囚徒困境”竞赛建议，一个使对策者显得不可训练的很好方式是采用“一报还一报”策略。这个策略的简单性，使得它容易表明它的固定的行为模式，并且它的易识别性使得对方很难继续假装不知道它。采用“一报还一报”是控制对方并让他适应你的一个有效方法。它拒绝被欺负，但它自己也不欺负人家。如果对方确实适应它了，其结果就是双方合作。事实上，威慑是通过信誉的建立而达到的。

[ 上一页 ] [ :1.70102872e+09 ] [ 下一页 ]