打字猴:1.701028982e+09

1701028982

1701028983 由于政治领导人的更换是民主政治的必要部分，这个问题必须用其他办法来解决。这里政党是有用的，因为它们能为它们选出的成员的行为向公众负责。选民和政党的关系是长期的，这就使政党要选出不会滥用权力的候选人。如果一个领导人被发现屈服于诱惑，选民们在下次评价选举同一政党的另一候选人时就会把它考虑进去。在水门事件之后选民对共和党的惩罚说明，政党确实要为其领导人的背叛负责。

1701028984

1701028985 一般来说，解决人事变动的组织办法需要考虑在特殊位置上个人任期之后的责任问题。对一个组织或公司而言，保证这种责任的最好方法是不仅考虑一个人在现在位置上的成功，而且还要考虑他留给下一任的位置的情况。例如，一个官员在就要调到新位置之前通过背叛同事而谋利，那么在评价这个官员政绩时就必须考虑这个事实。

1701028986

1701028987 合作理论对于人的选择以及机构的设计都有帮助。就个人来说，在进行这项研究中使我最吃惊的就是可激怒性的价值。在开始这个项目时，我相信人不要太急于发怒。“囚徒困境”的计算机竞赛的结果证明了快速反应挑战确实会更好。它表明如果你对无理的背叛反应缓慢，就会有一个发出错误信号的危险。让越多的背叛继续下去而不受惩罚，就越有可能使对方得出背叛能得到好处的结论。并且，这种模式建立得越强，就越难打破它。这意味着很快被激怒比慢些好。“一报还一报”的成功说明了这一点，通过马上反应，给对方一个反馈信号，背叛是没有好处的。

1701028988

1701028989 对潜在的违反军控条约的反应也说明了这一点。苏联对它与美国达成的条约的限度偶尔采取一些试探步骤，美国越快察觉这些试探并作出反应，情况就越好。等到它们积累起来就需要作出一个较大的，但有可能引起更多麻烦的反应。

1701028990

1701028991 反应的速度取决于发觉对方的一个特定选择所需要的时间。这个时间越短，合作就越稳定。一个快速的发现意味着相互作用的下一步就来得快，因此就增加了由系数w表示的未来的影响。因此，只有那些能够很快发觉被违反的军控条约才可能是稳定的。关键是要求这些违反能够在它们积累到使受害者的可激怒性已不够阻止背叛的程度之前被察觉。

1701028992

1701028993 与可激怒性的价值有关的竞赛结果与什么使得善良规则是集体稳定这样的理论分析是相辅相成的。为了能够阻止侵入，一个善良规则必须能够被对方的第一次背叛所激怒（第三章，命题4）。理论上，这个反应不需要是马上的，而且也不必一定要发生，但它必须是有一个最终要发生的真实的概率。重要的是不能使对方得到背叛的激励。

1701028994

1701028995 当然，可激怒性有它的危险，即如果对方确实只想尝试一次背叛，报复将导致进一步的报复，冲突将恶化成无止境的双方背叛，这当然是一个严重的问题。例如，在许多文化中家族之间的血恨会持续几年甚至几代（Black-Michaud 1975）。

1701028996

1701028997 冲突的持续是由于反射作用：双方用各自新的背叛反应对方上一次的背叛。一种解决办法是找一个中央权威，通过法律条款来控制双方。不幸的是，这种方法通常是不可行的。并且即使有法律的规定，通过法院处理像保证商业合同等日常事务的费用也使人望而却步。当采用中央权威是不可能的或代价太高的时候，最好的办法是依靠一个能自我控制的策略。

1701028998

1701028999 这样的自我控制的策略必须是可激怒的，但是反应必须不是太激烈以免导致一个无止境的背叛振荡。例如：假设苏联和其他华沙条约国家联合着手使它们在东欧的武装力量的一部分动员起来。这样能使苏联在爆发常规战争中得到更多的优势。北大西洋公约组织的有效反应应该是加强它自己的警戒状态。如果苏联往东欧增加部队，作为反应，北大西洋公约组织就应该从美国增加部队。贝茨（Betts 1982，pp.293—294）建议这种反应应该是自动的。这样就可以使苏联清楚地看到北约的这种增加部队是一个标准的程序，它只发生在苏联动员之后。他还建议这种反应是有限的，即每三个苏军师动员起来就调进一个美军师。实际上，这有助于限制反射作用。

1701029000

1701029001 有限的可激怒性是一个用来达到稳定合作的策略的有效的特性。“一报还一报”是用与对方背叛完全等量的背叛来反应。但在许多情况下，如果这个反应稍稍少于挑衅的话，合作的稳定性便可以得到增强。要不然，就很容易陷入彼此无止境地反应对方的上一步背叛。有几个方法可以控制反射作用。一个方法是首先背叛的一方要认识到对方的反应不应该再引起自己的另一个背叛。例如，苏联应该认识到北约的动员只不过是对它自己行为的一个反应而已，不应该被看作是威胁。当然，即使北约的反应是自动的和可预测的，苏联也不会这样看问题。因此，如果北约的反应在某种程度上小于苏联的动员还是有用的，如果苏联对此的反应也在某种程度上小于北约的动员，那么战备的升级就会稳定下来，并可能反过来回到正常状态。

1701029002

1701029003 幸运的是，友谊不是合作进化所必要的。正如堑壕战的例子说明的，即使是敌人也可以学到在回报的基础上发展合作。对关系的要求不是友谊，而是持续性。在国际关系中，主要大国能够确定它们将年复一年地打交道下去，这是件好事。它们的关系不一定总是双方有利的，但它是持续的。因此，下一年的相互作用将在这一年的选择上有一个很大的影响，合作有一个很大的机会最终得到进化。

1701029004

1701029005 预见性也不是必要的。正如生物的例子所证明的。但是没有预见性，进化的过程将要花很长的时间。幸运的是，人类确实有这种预见性，并用它加速本来是一个盲目的进化过程。最令人吃惊的是第一轮“囚徒困境”计算机竞赛和第二轮竞赛的差别。在第一轮中，参赛者是那些代表当时懂得如何能在“囚徒困境”中表现良好的对策专家。当他们的规则彼此配对时，他们的平均得分是2.1分，这只比从P=1（对双方背叛的惩罚）到R=3（对双方合作的奖励）的一半稍稍好一些。第二轮的参赛者做得好多了，平均得分是2.60分，这比从双方惩罚到双方奖励的3/4还好一些。[3]因此，参赛者能够用第一轮的结果预计在第二轮中怎样才能干得好些。总的来说，他们的预见性得到了高分的报偿。

1701029006

1701029007 第二轮比第一轮更复杂，基于回报的合作牢固地建立起来。各种想占那些在第一轮中出现的简单规则的便宜的企图，在第二轮中都失败了，这说明了像“一报还一报”这样的回报性策略的超常鲁棒性。也许能够指望人们会从计算机竞赛的经验中懂得回报在他们自己的“囚徒困境”的相互作用中的价值。

1701029008

1701029009 一旦宣布遵循回报，就要去实行它，如果你期望其他人既回报你的背叛也回报你的合作，你就应该明智地避免引起任何麻烦。并且你应该明智地在其他人背叛之后背叛以表示你是不可欺侮的，因此你使用基于回报的策略是明智的。任何人都应该这样。在这种方式下，对回报的价值的评价是一种自我强化，一旦它产生作用，就会变得越来越强。

1701029010

1701029011 这就是第三章所建立的棘轮作用的基本点：一旦基于回报的合作在群体中建立起来，它就不能够被试图占人便宜的一个小群体所征服。稳定合作的建立如果只基于盲目的进化力量，它就需要一个很长的时间，如果是明智的人来操作的话，它就可以很快地实现。本书中经验的和理论的结果，有助于人们更清楚地看到生活中潜在回报的机会。知道两次计算机“囚徒困境”竞赛结果的原因，了解回报成功的理由和条件，能为人们提供更多的预见。

1701029012

1701029013 我们可以更清楚地看到，“一报还一报”的成功不是由于它比与它打交道的任何人做得更好。它的成功是靠从其他人那里引出合作而不是靠背叛他们。我们习惯于把竞争考虑成只有一个胜利者，像踢足球或下棋，但世界上的事情很少像这样。在很多情况下，双方合作比双方背叛好。做得好的关键不在于征服对方而在于引导合作。

1701029014

1701029015 今天，人类面临的最重要的问题是，在国际关系舞台上，独立自私的国家在近于无政府状态下彼此对峙，这些问题中有许多采取的是“重复囚徒困境”的形式。具体例子是军备竞赛、核扩散、危机谈判和军事升级。当然，要在实际上了解这些问题就必须考虑许多不能并入简单的“囚徒困境”形式中的因素，如意识形态、官僚政治、承诺、联盟、调解和领导地位。然而，我们可以利用我们拥有的洞察力。

1701029016

1701029017 罗伯特·吉尔平（Robert Gilpin 1981，p.205）指出，从古希腊到现代的所有政治理论都说明了一个基本问题：人类（不管是出于自私或更宽大的目的）如何理解和控制似乎是盲目的历史的力量？在现代社会中这个问题由于有了原子弹而变得特别尖锐。

1701029018

1701029019 第六章中对“囚徒困境”竞赛者的劝告也可以作为对国家领导人的很好的劝告。不要妒忌，不要首先背叛，回报合作也回报背叛，不要太聪明。同样，第七章中促进“囚徒困境”中的合作的技术性探讨对促进国际政治中的合作也是有用的。

1701029020

1701029021 如何从合作中得到奖赏的问题核心在于试错学习是缓慢和痛苦的。这样的学习过程可能对长期发展有好处，但是我们可能没有时间等待这样盲目的过程而缓慢地走向基于回报的对双方有利的策略。也许，如果我们更好地了解这个过程，我们就能用我们的预见加快合作的进化。

1701029022

1701029023 [1]“囚徒困境”比这里所讨论的有更普遍的意义。“囚徒困境”的形式并不假设不管对方合作与否帮助的代价是相同的。因此，它使用一个附加的假设，即双方更偏爱相互帮助而不是有相同的机会剥削和被剥削。

1701029024

1701029025 [2]不足为奇的是，华盛顿成功的官员学会在这种“陌生人的政府”中依赖回报（Heclo 1977，pp.154—234）。

1701029026

1701029027 [3]这是除“随机”程序以外的所有对策者的平均得分，在第一轮竞赛中每次比赛有200步，而第二轮竞赛的步长不等，平均步长为151步。

1701029028

1701029029

1701029030

1701029031

[ 上一页 ] [ :1.701028982e+09 ] [ 下一页 ]