打字猴:1.70102901e+09
1701029010
1701029011 这就是第三章所建立的棘轮作用的基本点:一旦基于回报的合作在群体中建立起来,它就不能够被试图占人便宜的一个小群体所征服。稳定合作的建立如果只基于盲目的进化力量,它就需要一个很长的时间,如果是明智的人来操作的话,它就可以很快地实现。本书中经验的和理论的结果,有助于人们更清楚地看到生活中潜在回报的机会。知道两次计算机“囚徒困境”竞赛结果的原因,了解回报成功的理由和条件,能为人们提供更多的预见。
1701029012
1701029013 我们可以更清楚地看到,“一报还一报”的成功不是由于它比与它打交道的任何人做得更好。它的成功是靠从其他人那里引出合作而不是靠背叛他们。我们习惯于把竞争考虑成只有一个胜利者,像踢足球或下棋,但世界上的事情很少像这样。在很多情况下,双方合作比双方背叛好。做得好的关键不在于征服对方而在于引导合作。
1701029014
1701029015 今天,人类面临的最重要的问题是,在国际关系舞台上,独立自私的国家在近于无政府状态下彼此对峙,这些问题中有许多采取的是“重复囚徒困境”的形式。具体例子是军备竞赛、核扩散、危机谈判和军事升级。当然,要在实际上了解这些问题就必须考虑许多不能并入简单的“囚徒困境”形式中的因素,如意识形态、官僚政治、承诺、联盟、调解和领导地位。然而,我们可以利用我们拥有的洞察力。
1701029016
1701029017 罗伯特·吉尔平(Robert Gilpin 1981,p.205)指出,从古希腊到现代的所有政治理论都说明了一个基本问题:人类(不管是出于自私或更宽大的目的)如何理解和控制似乎是盲目的历史的力量?在现代社会中这个问题由于有了原子弹而变得特别尖锐。
1701029018
1701029019 第六章中对“囚徒困境”竞赛者的劝告也可以作为对国家领导人的很好的劝告。不要妒忌,不要首先背叛,回报合作也回报背叛,不要太聪明。同样,第七章中促进“囚徒困境”中的合作的技术性探讨对促进国际政治中的合作也是有用的。
1701029020
1701029021 如何从合作中得到奖赏的问题核心在于试错学习是缓慢和痛苦的。这样的学习过程可能对长期发展有好处,但是我们可能没有时间等待这样盲目的过程而缓慢地走向基于回报的对双方有利的策略。也许,如果我们更好地了解这个过程,我们就能用我们的预见加快合作的进化。
1701029022
1701029023 [1]“囚徒困境”比这里所讨论的有更普遍的意义。“囚徒困境”的形式并不假设不管对方合作与否帮助的代价是相同的。因此,它使用一个附加的假设,即双方更偏爱相互帮助而不是有相同的机会剥削和被剥削。
1701029024
1701029025 [2]不足为奇的是,华盛顿成功的官员学会在这种“陌生人的政府”中依赖回报(Heclo 1977,pp.154—234)。
1701029026
1701029027 [3]这是除“随机”程序以外的所有对策者的平均得分,在第一轮竞赛中每次比赛有200步,而第二轮竞赛的步长不等,平均步长为151步。
1701029028
1701029029
1701029030
1701029031
1701029032 合作的进化(修订版) [:1701027614]
1701029033 合作的进化(修订版) 附录A 竞赛结果
1701029034
1701029035 附录A为第二章提供了关于两轮计算机“囚徒困境”竞赛的补充信息。它包括参赛人员的信息、提交的参赛程序以及与其他程序比赛时的成绩,它还考察了在6个变形竞赛中所发生的情况,并为“一报还一报”成功的鲁棒性提供了附加的证据。
1701029036
1701029037 第一轮的参赛者包含了14项参赛程序再加上“随机”程序,参赛者的名单和他们的决策规则的得分列在表A.1。每对规则比赛5次,每次比赛有200步,每个规则对各个其他规则的竞赛得分列在表A.2。每个策略的描述在罗伯特·阿克塞尔罗德(Axelrod 1980a)中给出,它也就是给参加第二轮竞赛者的报告。
1701029038
1701029039 表A.1 第一轮参赛者
1701029040
1701029041
1701029042
1701029043
1701029044
1701029045
1701029046
1701029047 表A.2 第一轮竞赛得分
1701029048
1701029049
1701029050
1701029051
1701029052 第二轮的参赛者名单以及一些有关他们的程序的情况列在表A.3。每对规则比赛5次,每次比赛的步数是变的,但平均值是每次151步。有62个参赛程序再加上“随机”程序。因此,第二轮竞赛得分是一个63乘63的大矩阵。表A.4只好用压缩形式来表示它们,每一个规则与其他各个规则相遇的平均得分按以下编码表示:
1701029053
1701029054 1:小于100分
1701029055
1701029056 2:100—199.9分(151分是双方总是背叛的得分)
1701029057
1701029058 3:200—299.9分
1701029059
[ 上一页 ]  [ :1.70102901e+09 ]  [ 下一页 ]