打字猴:1.70102791e+09

1701027910

1701027911 在最后一章，我们的讨论从研究在没有集权的情况下合作如何在自私者中产生，扩展到分析当人们确实互相关心时会发生什么和当有集权时又会发生什么。基本方法还是一样：通过观察个体为了自身利益的所作所为来揭示群体的行为发展。这个方法超越了个人的视野。它告诉我们在给定的情况下如何促进稳定的双边合作。最有价值的发现是：具有预见能力的参与者了解合作理论的真谛后，可以加快合作的进化。

1701027912

1701027913 [1]有关国际政治上的应用例子可以参见以下文献：安全困境（Jervis 1978）、军备竞赛和裁军（Rapoport 1960）、联盟竞争（Snyder 1971）、关税谈判（Evans 1971），多国公司的税收（Laver 1977）和塞浦路斯的种族冲突（Lumsden 1973）。

1701027914

1701027915 [2]“囚徒困境”游戏于1950年由梅里尔·弗勒德（Merrill Flood）和梅尔文·德莱希尔（Melvin Dresher）始创，之后由A.W.塔克（A.W. Tucken）将其定形完善。

1701027916

1701027917 [3]两人以上相互作用的情形可以用较复杂的n人“囚徒困境”作模型（Olson 1965；G. Hardin 1968；Schelling 1973；Dawes 1980；R. Hardin 1982）。主要应用于集体财产的提供问题。两人相互作用的结果可能会对深入分析n人情形有一定帮助，但事实如何还需观望等待。关于同时处理两人和n人的情形，请参见Taylor（1976，pp.29—62）。

1701027918

1701027919 [4]当对方使用“一报还一报”策略时，如果你总是背叛，你的得分为：

1701027920

1701027921 V（“总是背叛”|“一报还一报”）=T+wP+w2P+w3P…=T+wP（1+w+w2+w3…）=T+wP/（1-w）

1701027922

1701027923 [5]如果对方采用永久报复策略，当R/（1-w）＞T+wP/（1-w）或w＞（T-R）/（T-P）时，你最好从不背叛，永远合作。

1701027924

1701027925 [6]这就是说，实际效用只需用相对尺度来衡量。采用相对尺度意味着收益值的表示在进行正的线性变换后，其本身保持不变，正如用华氏或摄氏测量温度的结果是一样的。

1701027926

1701027927 [7]有关在经济变化的进化模型中没有谨慎选择的意义，可参见Nelson and Winter（1982）。

1701027928

1701027929

1701027930

1701027931

1701027932 合作的进化（修订版） [:1701027602]

1701027933 合作的进化（修订版）第二部分合作的出现

1701027934

1701027935 合作的进化（修订版） [:1701027603]

1701027936 第二章 “一报还一报”在计算机竞赛中的胜利

1701027937

1701027938 由于“囚徒困境”如此普遍地出现在从个人关系到国际关系的事务中，因此知道在这种情形下采取什么行动最好是很有用的。可是，第一章的命题说明没有最好的策略可用。什么是最好的策略部分取决于另一对策者会怎么做。而且，另一对策者会怎么做又很大程度地取决于这个对策者对你行为的预期。

1701027939

1701027940 为了摆脱这种困惑，可以通过收集那些有关“囚徒困境”的资料来获得有用的建议。幸运的是，在这个方面已经有了很多的研究。

1701027941

1701027942 通过使用实验对象，心理学家们已经发现，在“重复囚徒困境”中，所得到的合作和获得合作的特定模式取决于游戏的环境、各个对策者的品质特征及对策者之间的关系等各式各样的因素。由于在这个游戏中的行为反映了人们如此多的重要因素，“囚徒困境”已经变为一个标准的方式，用来探讨社会心理学中的各种问题，从中非的西方化的影响（Bethlehem 1975）、职业妇女的侵犯性是否存在（Baefsky and Berger 1974）到抽象和具体的思维风格的不同结果（Nydegger 1974）。在过去的15年中，《心理学摘要》引用了好几百篇有关“囚徒困境”的文章。“重复囚徒困境”已成为社会心理学的标准实验手段。

1701027943

1701027944 与作为实验基础同样重要的是，用“囚徒困境”作为主要社会过程模型的概念基础。理查森的军备竞赛模型就是以“囚徒困境”的相互作用为基础的，不同的只是用竞争国家的军备预算每年玩一次游戏（Richardson 1960；Zinnes 1976，pp.330—340）。卖方市场的竞争也可以用“囚徒困境”来模拟（Samuelson 1973，pp.503—505）。普遍存在的由集体行动产生集体利益的问题也可以作为多人的“囚徒困境”来分析（G. Hardin 1982）。就连投票交易也被模拟成“囚徒困境”（Riker and Brams 1973）。事实上，许多重要的政治、社会和经济过程的最好的模型都是以“囚徒困境”为基础的。

1701027945

1701027946 还有第三类关于“囚徒困境”的文献，它既不是实验室里也不是实际生活中的经验问题，而是用抽象的博弈论来分析一些基本策略问题的特性，如理性的意义（Luce and Raiffa 1957）、影响他人的选择（Schelling 1973）和没有强迫的合作（Taylor 1976）。

1701027947

1701027948 不幸的是，这三类文献都没有揭示如何更好地玩这个游戏。实验研究也没有什么帮助，因为所有实验都是基于对第一次见到这个游戏的人的选择的分析。他们对策略的微妙之处的认识是很有限的。虽然实验对象可能对每天都会发生的“囚徒困境”有许多经验，但是他们在正规的实验中使用这些经验的能力是有限的。有些“囚徒困境”的应用文献研究了富有经验的经济、政治方面的名流在实际情况下的选择。但是结果并没有多大帮助，因为大多数高水平的相互作用的进程相对来说是缓慢的，而且要改变环境是困难的。用这种方式分析和认同的选择总共不到十几个。最后，对策略相互作用的抽象分析通常包括对“重复囚徒困境”的一些变体的研究。它们通过引入一些对策上的变化，诸如允许相互依赖的选择（Howard 1966；Rapoport，1967），或者给背叛加罚（Tideman and Tullock 1976；Clarke 1980）来消除困境本身。

1701027949

1701027950 为了学到更多关于在“重复囚徒困境”中如何有效地选择，需要一个新的方法，这个方法必须从对非零和博弈所固有的策略可能性有深刻理解的人那里得到帮助。在非零和博弈中参与者的利益一部分是一致的，一部分是冲突的。应该考虑有关非零和博弈的两个重要事实：首先，第一章的命题说明，一个策略是有效的不仅取决于一个特定策略的特征，而且取决于它所要遭遇的其他策略的特性。其次，根据第一点，一个有效的策略必须在任何时候都能考虑到相互作用的历史。

1701027951

1701027952 研究在“重复囚徒困境”中有效选择的计算机竞赛满足了这些要求。在计算机竞赛中，每个参加者写一个体现在每一步中选择合作或不合作的规则的程序，这个程序在作选择时可以利用对局的历史。如果参加者主要是从那些熟悉“囚徒困境”的人中征募的，那么参加者的程序必将与其他有见识的人的程序相遇。这样就能保证竞赛的水平。

1701027953

1701027954 为了看看到底会发生什么，我邀请了博弈论专家提送程序参加上述的计算机竞赛。竞赛是循环进行的，即每一个参赛程序都与其他程序相遇。按照事先宣布的竞赛规则，每一个参赛程序还要与它自己以及一个“随机”程序相遇。这个随机程序，以相等的概率随机地选择合作或背叛。每轮游戏有200次对局。[1]每次对局的支付矩阵与在第一章中描述的一样。对双方合作奖励每人3分，对双方背叛只给1分。如果一个人背叛而另一人合作，背叛者得5分，合作者得零分。

1701027955

1701027956 没有参赛者因为超过规定时间而被取消资格。事实上为了得到每对参赛者得分的更稳定的估计，整个循环赛重复了5次，一共是12万次对局，24万个不同的选择。

1701027957

1701027958 提交的14个程序，来自5个学科：心理学、经济学、政治学、数学和社会学。附录A中列出了这些送交程序的人及其所属学科，并给出了他们的程序的名次和得分。

1701027959

[ 上一页 ] [ :1.70102791e+09 ] [ 下一页 ]