打字猴:1.70102786e+09
1701027860
1701027861 命题1:如果折扣系数w足够大,则不存在独立于对方所采用的策略的最优策略。
1701027862
1701027863 证明这个命题是不困难的。设想对方采用“总是背叛”策略,也就是他决不会合作,那么,不难理解你最好也是总是背叛。另外,假定对方采用一个被称为“永久报复”的策略,这个策略首先是采取合作直到你背叛,然后就一直以背叛来报复你。在这种情况下,你的最优策略是决不背叛。因为第一步背叛得到的好处最终将被长期的惩罚所抵消,它将使你得到长期的“惩罚”P而不是“奖励”R。当折扣系数w足够大时,这个论断是正确的。[5]因此你是否合作,即使在第一步,也取决于对方采用什么样的策略。所以,当w足够大时,不存在最优策略。
1701027864
1701027865 在立法机构,如美国参议院的例子中,这个命题说明,如果存在一个很大的机会使得一个议员将与另一个议员再次打交道,那么就不存在独立于其他议员所采用的策略的最优策略。你最好与那些在将来会回报合作的人合作,但不要与那些将来的行为不太受现在影响的人合作(例如参见Hinckley 1972)。达到稳定的相互合作的可能性取决于双方继续打交道的机会的大小,即w的大小。在国会的例子中,由于两年一次的议员更换率从头50年的40%下降到近几年的20%左右,两个议员继续打交道的机会增加很快(Young 1966,pp.87—90;Polsby 1968;Jones 1977,p.154;Patterson 1978,pp.143—144)。
1701027866
1701027867 然而,说继续打交道的机会对于合作发展是必要的并不等于说它是充分的。不存在单一的最优策略的论证留下了这样一个问题,在两个个体有足够大的概率继续打交道的情况下,会出现什么样的行为模式。
1701027868
1701027869 在继续研究可能出现的行为之前,我们最好仔细观察“囚徒困境”的框架里包含了哪些现实的特征。幸运的是,这个框架很简单,它避免了许多可能限制分析者的约束性假设。
1701027870
1701027871 1.对策者的收益不必是可比较的。例如:对一个记者的奖赏有可能是得到另一个内部消息,而对一个合作的官员的奖赏则可能是一次使他的政策建议得到好评的机会。
1701027872
1701027873 2.这些收益不必是对称的。当然从对策者双方的角度来看,收益自然应该绝对相等,但这并不是必要的。例如:你不必假设双方合作的奖励或者其他三个收益参数对每个对策者都同样重要。像前面所提到的,你不必假设它们是可以比较的。必须假设的是,对每个对策者来说,四种收益是按“囚徒困境”的定义要求排序的。
1701027874
1701027875 3.对策者的收益值只是相对的,不是绝对的。[6]
1701027876
1701027877 4.决定是否合作不必顾及他人的看法。时常会有人想阻拦而不是培育对策者之间的合作。商业上的勾结对参与者有好处,但对他人则可能不利。事实上,绝大部分的贿赂就是一个当事人高兴而其他人厌恶的合作的例子。因此,偶尔这个理论也会反过来被用于如何防止而不是促进合作。
1701027878
1701027879 5.不必假设对策者是理性的。不必假设他们总是企图争取最大利益。他们的策略有可能只是简单地反映标准的操作程序、经验、直觉、习惯或模仿他人(Simon 1955;Cyert and March 1963)。
1701027880
1701027881 6.对策者的行为不必都是有意识的选择。一个人有时会回报一个恩惠,有时不会,他可能不会认真思考他采用的是什么策略。因此不必假设所有的选择都是深思熟虑的。[7]
1701027882
1701027883 这个框架之大,不仅包含了人,而且大到国家和小到细菌均包含在内。国家的一些行为显然可以解释为“囚徒困境”中的选择,如:关税的升降。没有必要假设这些行为是理性的或是追求单一目标的结果。相反,它们完全可能是错综复杂的官僚政治的结果(Allison 1971)。
1701027884
1701027885 同样,在另一个极端,一个有机体不需要脑袋来玩游戏。例如,细菌对它们选择的化学环境是高度敏感的。因此它们能够对其他有机体的行为作出不同的反应。这些行为的条件策略是可以遗传的。而且,一个细菌的行为会影响周围有机体的适应性,就像其他有机体的行为会影响某个细菌的适应性一样。关于这方面的内容,我们将在第五章讨论。
1701027886
1701027887 现在先让我们把主要的兴趣放在人和组织上。为了通用性的缘故,我们最好记住没有必要假设人们是多么地深思熟虑和富有洞察力。也不要像社会生物学家一样,假设人类的主要行为是由基因引导的。这里所使用的方法是策略性的而不是遗传性的。
1701027888
1701027889 当然,把合作问题抽象为“囚徒困境”要忽略许多实际问题本身的重要特点。例如,这种完全的抽象没有考虑语言交流的可能、第三者的直接影响、一个选择的实现问题以及对方上一次选择的不确定性。在第八章中,一些类似的复杂因素将被加入基本模型中,显然还有许多因素值得考虑和研究。任何一个聪明人都肯定不会在作出重要选择时忽略这些复杂的因素。然而,不考虑这些复杂因素而作出的分析能够帮助我们弄清人们相互作用的一些微妙特征。否则这些特征在人们作出选择时容易被错综复杂的实际情况所淹没。正是现实的复杂性使得抽象的分析变得更有价值。
1701027890
1701027891 下一章通过研究什么是囚徒困境中的好策略来探讨合作的产生。使用的是一个新颖的方法:计算机竞赛。对策论专家被邀请提送他们所喜爱的策略。每个策略与其他所有策略逐个对局,看看哪个策略的表现从总体来说是最好的。令人惊讶的是:胜利者是所有提交策略中最简单的一个策略,它就是“一报还一报”。这个策略首先在第一步合作,然后就模仿对方上一步的选择。第二轮计算机竞赛有更多的参赛程序,它们是由一些业余爱好者和专家们提送的,他们都知道第一轮计算机竞赛的结果。然而,第二轮又是“一报还一报”取胜!对竞赛数据的分析揭示了一个成功的决策规则所应有的四个特性:只要对方合作你就合作以避免不必要的冲突;面对他人的无理背叛你是可激怒的;在给挑衅以反击之后你是宽容的;行为要简单清晰,使对方能适应你的行为模式。
1701027892
1701027893 这些竞赛的结果表明,在适当的条件下,合作确实能够在没有集权的自私自利者的世界中产生。在第三章中,我们将采用理论方法来探索这些结果究竟能适用多大范围。一系列命题的证明不仅说明了合作产生的条件,而且提供了合作演化的进程。这里先作一个简单的论述。合作的进化要求个体有足够大的机会再次相遇,使得他们能形成在未来打交道的利害关系,如果是这样的话,合作的进化可以分三个阶段。
1701027894
1701027895 1.起始阶段:合作可以在一个无条件背叛的世界里产生。零散个体之间几乎没有机会交往,合作也就不会产生。然而,以相互回报合作为宗旨的小群体之间,一旦有交往的可能,合作便会出现。
1701027896
1701027897 2.中间阶段:基于回报的策略能够在许多不同类型的策略组成的环境里成长起来。
1701027898
1701027899 3.最后阶段:基于回报的合作一旦建立起来,就能防止其他不太合作的策略的侵入。因此,社会进化的齿轮是不可逆转的。
1701027900
1701027901 第四章和第五章将具体说明这些结果的适用范围。第四章专门论述有趣的“自己活也让别人活”的系统。它出现在第一次世界大战的堑壕战中。在这次痛苦的冲突中,只要能得到对方士兵的回报,前线的士兵经常忍住不开枪打伤对方。使这个双方自我约束成为可能的是堑壕战的特点,即双方小股单位相互对峙一段相当长的时间。这些对立的士兵们为了保持双方合作的默契,实际上违抗了他们各自上司的命令。仔细观察这个实例可以发现,当合作的条件出现时,合作可以在原来毫无希望的情况下出现且保持稳定。特别是这个“自己活也让别人活”的系统说明了朋友关系不是合作产生的必要条件。在适当的条件下,基于回报的合作甚至可以在对抗双方中产生。
1701027902
1701027903 第五章(与进化生物学家威廉·D.汉密尔顿合著)的论述说明,合作可以在没有预见的情况下产生。合作理论可以说明从细菌到鸟的一个很宽范围的生物系统的行为模式。生物系统中的合作即使在参与者不相互联系,或它们没有能力评价自己行为后果的情况下也有产生的可能。使这种可能出现的前提是基因的进化机制和适者生存。一个能够从其他个体得到有利的反应的个体会有更多的后代,而且这些后代将继续这个能从其他个体引出有利反应的行为模式。因此,在适当的条件下,基于回报的合作在生物世界是稳定的。第五章还进一步描述了合作理论在领地、交配和疾病等方面的应用。结论是达尔文所强调的个体优势实际上就是相同或者甚至不同种类个体之间合作出现的原因。只要适当的条件出现,合作就能够产生、成长并保持稳定。
1701027904
1701027905 虽然预见对于合作的进化不是必要的,但它的确很有帮助。第六章和第七章分别向参与者和改革者提供建议。第六章阐述了合作理论给任何处于“囚徒困境”的人的启示。以参与者的眼光来看,他们的目的就是尽可能做得更好些,而不要管其他人做得怎样。在竞赛结果和理论命题的基础上,我们可以向个体选择提供四个方面的建议:不要妒忌对方的成功;不要首先背叛;要对合作和背叛都作出回报;不要耍小聪明。
1701027906
1701027907 了解参与者的观点可以成为探索什么能使合作更容易从自私者中间产生的基础。因此,第七章描绘了一个具有远大眼光的改革者想要通过改变相互作用的条件来促进合作。为此,我们考虑了各种各样的方法,如使对策者之间的相互作用更持久、更经常;教育参与者更多地相互关心;教会他们理解回报的价值。这个改革者的观点为各式各样的问题提供了有远见的建议,从政府的控制力度到吉普赛人的困难,从“一报还一报”的道德问题到写条约的艺术。
1701027908
1701027909 第八章扩展了合作理论应用的领域。它说明了不同类型的社会结构如何影响合作发展的方式。例如,人们的相互联系经常受到某些可以观察到的特征如性别、年龄、肤色和穿着风格的影响。这些特征导致了以偏见和地位层次为基础的社会结构。社会结构的另一个例子是声誉的作用。为建立和保持某人的声誉而奋斗可能是强烈冲突的主要特征。例如,美国政府1965年对越南战争的逐步升级的主要原因是它急于保持在世界舞台上的声誉以阻止对其利益的其他挑衅。这一章还考虑了政府如何保持它对自己公民的信誉。一个政府不能推行那些必然遭到大多数公民抱怨的规范。要使规范生效就要求所设置的规范能使大多数的公民觉得服从它能得到好处。这个方法揭示了权力运作的基础。工业污染的控制、离婚后对财产的监督都是它的具体应用。
[ 上一页 ]  [ :1.70102786e+09 ]  [ 下一页 ]