打字猴:1.70102854e+09

1701028540 国会是一个很好的例子。国会议员可以相互合作而不威胁到各自在选区的名望。对于一个议员的主要威胁不是另一个来自这个国家其他地区的议员的相对成功，而是来自可能在选区进行挑战的人。因此妒忌其他议员从双方合作得来的成功是没有多大意义的。

1701028541

1701028542 在生意场中也是这样，一个从供应商那儿买来东西的公司期望有一个供方和买方都有好处的成功的关系。妒忌供方的利润是完全没有意义的。任何通过不合作行为（如不按时付账）来减少这种利润的企图，都将激起供方的报复行动，报复行为可以采用多种形式，经常以不明显惩罚形式，诸如拖延发货，较低的质量保证，不愿意打折扣，或者不交换市场条件变化的信息（Macaulay 1963）。这种报复使得嫉妒代价很大。买者不要担心卖方的相对利润，而可以考虑是否有其他更好的购买策略。

1701028543

1701028544 不要首先背叛

1701028545

1701028546 竞赛和理论分析的结果都表明，只要对方合作，你合作就会有好处。第二章中的竞赛结果是很令人吃惊的。决定一个规则表现如何的唯一最好的特征是这个规则是否善良，也就是说这个规则是否不首先背叛。在第一轮竞赛中，前8名规则都是善良的，在后7名规则中没有一个是善良的。在第二轮竞赛中，前15名规则中只有一个是非善良的（它名列第8），而后15名规则中只有一个是善良的。

1701028547

1701028548 有些不善良的规则，使用相当复杂的方法来试探它是否能逃脱惩罚。例如“检验者”尝试在第一步背叛，如果对方报复的话，它就马上撤回。在另一例子中“镇定者”倾向于在背叛前等待十几步，看看对方是否能被哄骗和被偶尔占便宜。如果是的话，“镇定者”就更频繁地增加背叛，直到对方反击而被迫撤回。但是这些尝试首先背叛的策略都表现得不怎么好。因为存在许多由于愿意报复而不被占便宜的策略，所以导致冲突的代价有时是很高的。

1701028549

1701028550 甚至许多专家也没有意识到善良性对避免不必要的冲突的价值。在第一轮竞赛中，由对策专家送来的规则中几乎有一半是不善良的。参考了第一轮的明显结果，第二轮比赛中大约有1/3的规则采用不善良的策略，但是，它们都没有占到便宜。

1701028551

1701028552 第三章的理论结果提供了另一个方式来说明为什么善良的规则能表现得如此好。由于善良的规则相互之间相处得很好，因此善良规则的群体是很难被侵入的。而且能够阻止单个变异个体侵入的善良规则的群体也能阻止这个变异规则的任何小群体的侵入。

1701028553

1701028554 理论的结果给善良策略的优势带来了一个很大的限制，即当未来的相遇相对于从背叛得到的直接好处不足够重要时，单等对方背叛就不是一个好主意。必须记住只有当折扣系数w相对于收益参数R、S、T和P足够大时，“一报还一报”才是一个稳定的策略。特别是命题2表明，如果折扣系数不足够大，当对方采用“一报还一报”时，你最好采用“背叛”和“合作”交替的策略或甚至总是背叛。因此，如果对方似乎不再见面，马上背叛比善良要好。

1701028555

1701028556 这个事实对于那些大家都知道的从一个地方迁移到另一个地方的群体有一个不幸的含义。一位人类学家发现当吉普赛人接近非吉普赛人时，总怕惹上麻烦，非吉普赛人接近吉普赛人时总怀疑会被骗。

1701028557

1701028558 例如，一个医生被叫去看一个病得很厉害的吉普赛小孩。他不是第一个被叫的医生，但他是第一个愿意来的医生。我们拥着他走向后卧室，但他在病人屋门前停下说：“这次上门是15美元，上次还欠我5美元，在我看病人之前付我20美元。”“行，行，你会得到的，先看孩子吧，”吉普赛人恳求道。争执了几个回合后我出面调停，付10美元后医生查看了病人。看病之后，我发现这个吉普赛人出于报复，根本就不想付那另外的10美元。（Gropper 1975，pp.106—107）

1701028559

1701028560 在加利福尼亚社区，时有发现吉普赛人不付医生账单，但是市政罚款却都是马上就付（Sutherland 1975，p.70）。这些罚款大都是由于违反垃圾管理。这些吉普赛人每年冬天都回到同一城市。可以推测这些吉普赛人知道他们必须继续与这个城市的垃圾站打交道而不能换另一个。相反，在这个地区有足够的医生，得罪一个医生，在需要时可以再找另一个。[3]

1701028561

1701028562 短暂的接触不是使首先背叛有好处的唯一条件，另一个可能性是合作得不到回报。如果其他人都采用“总是背叛”的策略。那么一个单一的个体就不可能做得比使用“总是背叛”更好。但是，如第三章所示，即使回报性策略（如“一报还一报”）之间相互作用的比例很小，采用“一报还一报”也比采用群体中大多数采用的“总是背叛”的策略好。第三章的数值例子说明，只要5%的比例与类似“一报还一报”的策略打交道就能使这个小群体的成员比大多数背叛的成员做得更好。[4]

1701028563

1701028564 那么是否有人会回报某人最初的合作呢？在某些情形下是很难预测的。但是如果有足够的时间尝试各种不同的策略，并且在某种方式下，更成功的策略能变得更普遍，那么你就完全可以相信，会有人回报合作的。理由是，即使是一个相当小的善良策略的群体也能侵入到“小人”的群体，并且在它们自己相互之间所得的高分的基础上成长起来。一旦善良的策略站稳脚跟它们就能抵制“小人”的反侵入。

1701028565

1701028566 当然，你可以尝试更保险的方式，即先背叛直到对方合作，才开始合作。然而，竞赛的结果表明，这实际上是一个很有风险的策略，因为你最初的背叛就可能引起对方的报复。并使你处于要么被占便宜要么双方背叛的两难境地。如果你惩罚对方的报复，这种反应就会一直延续下去。如果你宽恕了对方，你就得冒被欺负的风险。即使你能避免这些长远问题，对你的最初背叛的当下报复会使你希望自己从一开始就应该是善良的。

1701028567

1701028568 对竞赛的生态分析揭示了另一个为什么首先背叛是很冒险的道理。第二轮竞赛中前15名规则中唯一的非善良策略是名列第8的“哈林顿”。这个规则表现得很好。因为它与竞赛中的名次较低的规则相遇时得分都很高。在假想的未来生态竞赛中，名次较低的规则在群体中的比例越来越小。最终能被这个最初挺成功的非善良策略占便宜的策略就越来越少，接着它自己也消亡了。因此生态分析说明，与那些自己本身得分并不高的策略相遇你表现得很好是没有用的，它只不过是一个自我毁灭的过程。这个教训说明，虽然不善良在最初看来似乎是很有希望的，但长期下去它将毁坏使自己成功所必需的环境。

1701028569

1701028570 对合作与背叛都要给予回报

1701028571

1701028572 “一报还一报”超常的成功给出了一个简单的但又是很有力的建议：要回报。在第一步合作之后，“一报还一报”只是简单地回报对方在上一步的所为。这个简单的规则具有惊人的鲁棒性。它赢得了第一轮“囚徒困境”计算机竞赛，并取得比任何其他由对策专家们送来的规则更高的平均得分。每一个第二轮竞赛的参加者都知道这个结果，但“一报还一报”又赢了第二轮竞赛。这个胜利显然是令人惊讶的。因为每一个参赛者是在考虑了“一报还一报”在第一轮竞赛中的胜利结果之后，才提交他们的参赛规则的。显然人们都希望他们能干得更好，但是他们错了。

1701028573

1701028574 “一报还一报”不仅赢得竞赛本身，而且在假设的继续比赛中比其他任何规则表现得都好。这表明“一报还一报”不仅与最初的各种规则相处得很好，而且能与那些可能在未来群体中占较大份额的成功的规则也相处得很好。它不毁坏自己成功的基础，相反，它在与其他成功的规则相互交往中繁荣起来。

1701028575

1701028576 “一报还一报”所体现的回报在理论上也是很重要的。当未来相对于现在是足够重要的时候，“一报还一报”是集体稳定的。这就意味着，如果每个人都使用“一报还一报”策略，那么对一个特定的个体的最好建议就是也采用“一报还一报”策略。或者这么说，如果你能肯定对方是采用“一报还一报”，并且这种交道将持续足够长时间，那么，你最好也采用相同的策略。“一报还一报”的回报性的精彩之处在于它能在很大范围的环境中表现出色。

1701028577

1701028578 事实上，“一报还一报”很善于区分哪些规则会回报它的最初合作而哪些则不会。从第三章引入的概念看，它是有最大识别力的。如命题6所示，这就使得它能够以一种小群体的形式侵入“小人”的世界。并且，它回报背叛也回报合作。这使得它是可激怒的。命题4证明了，像“一报还一报”这样的善良策略要阻止被侵入，就必须是可激怒的。

1701028579

1701028580 在反应对方的背叛时，“一报还一报”保持了惩罚和宽恕的平衡。“一报还一报”总是在对方每次背叛之后只背叛一次。这样它在竞赛中取得了成功。那么，是否总是严格的一对一回报才是最有效的平衡？这就很难说了，因为稍有不同平衡的规则并没有被提送参赛。但有一点是清楚的，即用多于一次背叛来回报对方的背叛将有可能使冲突升级。另一方面，少于一对一的回报将有被占便宜的危险。

1701028581

1701028582 “两报还一报”是一个只有当对方在前两步连续背叛时，它才背叛的规则。因此它是一对二回报。这个相对宽容的规则如果被提送就会赢得第一轮竞赛。它能做得如此好是因为它能避免与某些甚至引起“一报还一报”麻烦的其他规则陷入双方报复的境地，但是当它真的被送交参加第二轮竞赛时，它甚至没有进入前1/3名次。原因是在第二轮竞赛中有些规则利用它对单一背叛的宽恕而占它的便宜。

1701028583

1701028584 以上分析的启示是，最优的宽恕水平与环境有关。特别是如果主要的危险是来自那些善于占“好说话”规则便宜的策略，那么，太多的宽恕就要付出代价。对一个给定的环境，准确的平衡是很难确定的，但是，竞赛的结果证明，对背叛类似一对一的反应可能在大多数情况下都是相当有效的。因此，对参与者的一个很好的建议是对合作和背叛都要给予回报。

1701028585

1701028586 不要耍小聪明

1701028587

1701028588 竞赛结果表明，在“囚徒困境”的情况下人们容易耍小聪明，然而复杂的规则并不比简单的规则做得更好。事实上，所谓最大化规则表现很差就是因为它们经常陷入双方背叛。这些规则的共同问题是，使用一些复杂的方法来推断对方。而这些推断常常是错误的。一部分问题是对方经常用试探性的背叛来表明它不会被引诱而合作，但是问题的关键是这些最大化规则没有考虑到它自己的行为会引起对方的变化。

1701028589

[ 上一页 ] [ :1.70102854e+09 ] [ 下一页 ]