1702934997
当代西方国际关系理论 第六节 博 弈 论
1702934998
1702934999
一、研究“合理行为”的策略和方法
1702935000
1702935001
博弈论是科学行为主义学派极为推崇的一种理论框架,它包含研究“合理行为”的策略和方法,是游戏规则和策略选择的统一。
1702935002
1702935003
什么样的行动最为合理?如何抉择才能获胜?对这些问题的研究古已有之,它们也是博弈论试图解决的问题。博弈论萌芽于18世纪初,但其真正的发展还在20世纪。“博弈”原是数学中运筹学的一个重要概念。20世纪20年代,法国数学家布莱尔用最佳策略法研究弈棋和其他具体的决策问题,并从数学角度作了尝试性的分析。第二次世界大战期间,博弈论的思想方法、研究手段被运用到军事领域和战时的其他活动中,显示了它的重要作用。1944年约翰·纽曼和摩根斯坦合著的《博弈论与经济行为》一书的出版标志着博弈理论的初步形成。纽曼和摩根斯坦认为,博弈论是关于运用数学方法研究处于利益冲突的双方在竞争性活动中制定最优化的胜利策略的理论,博弈方法即根据游戏规则选择处理竞争、冲突或危机的最佳方案。
1702935004
1702935005
博弈论涉及到复杂的数学分析和逻辑推理,但对博弈的理解既可“深入”也可“浅出”。事实上,我们在日常生活中经常需要先分析他人的意图从而作出合理的行为选择,而所谓博弈就是行为者在一定的环境条件和规则下,选择一定的行为或策略加以实施并取得相应结果的过程。博弈论的目的就在于向行为者表明:在所有理性参与者都想获胜或使收益最大化的情况下,他们可以根据博弈论的计算方法找到一种最有利的途径。因此博弈论也被称为“对策理论”或“游戏理论”,它是基于数理分析和逻辑推理基础上的一种合理决策理论。
1702935006
1702935007
20世纪50年代以后,国际关系理论学者在运筹学的博弈概念基础上综合运用心理学、统计学、社会学和策略学等原理,逐步形成国际关系学的博弈论。其主要代表著作有:托马斯·谢林的《博弈:冲突策略》、约翰·哈森尼的《博弈论与国际冲突分析》、马丁·舒比克的《博弈论的应用》、邓肯·卢斯和霍华德·雷法合著的《博弈与决策》、P·C·奥迪斯霍克的《博弈论与政治学》、阿纳托尔·拉波波特的《囚犯的困境》等,特别要提及的是卡尔·多伊奇的《国际关系分析》和莫顿·卡普兰的《国际政治的系统和过程》两本名著。学者们从不同角度阐明和丰富了博弈论的内容。他们强调指出:博弈论既是研究国际冲突的策略理论,又是处理国际关系的实际手段,其目的是为行为者在面临冲突和危机时设计各种合理选择和理性行为。
1702935008
1702935009
西方学者曾从各种不同的角度对博弈论下过定义,但无论他们的观点存在什么差别,一般来说,博弈包括下列几个要素:(1)弈者(参与者或行为者),每场博弈都有两个以上弈者组成;(2)收益,由于行为者的价值体系不同,收益也不同;(3)规则,只有遵守规则才能使博弈正常进行;(4)信息条件,它决定每一行为者对博弈环境以及其他行为者的选择所掌握的信息数量和质量;(5)每一行为者用来达到目的的战略;(6)进行博弈的整体环境,不论行为者是否对此有充分的认识;(7)动态的相互作用,在这个过程中,一方的选择可能促使对方改变选择(79)。
1702935010
1702935011
在上述要素中,策略选择是中心环节。而选择最佳战略需要有充分的信息,关于环境、条件等方面的信息是重要的决策依据和决定博弈结构的重要因素。但博弈者得到的信息往往是有限的,一般很难确切知道对方的实力、意图和战略战术,在这种条件下,博弈者可以根据博弈论的原理找到一个最佳的策略或策略组合,有的也可以在动态或多次重复的博弈过程中使决策合理化。一些西方学者认为,在风云变幻的国际舞台上,不合理行为俯拾即是,而合理行动的条件却难以寻觅。另一些学者不同意上述观点,他们的理由是:虽然一国的基本政策目标会发生变化,一国的具体政策不可能分毫不差地同既定目标保持一致,但是从长期来看,一国的政策目标是相当稳定的,其变化一般非常缓慢。此外,很多外交决策是在仔细权衡了利弊得失之后作出的,这正符合“合理行为”的分析模式。
1702935012
1702935013
二、“博弈模式”:“谁是懦夫”与“囚犯困境”
1702935014
1702935015
博弈的形式多样又多变,但基本的形式有零和博弈和变数博弈两种,一般又分为两方零和博弈、多方零和博弈、两方变数博弈和多方变数博弈。零和博弈又称为“谁是懦夫”博弈,指一方所失即他方所得,(-1)+(+1)=0;变数博弈又称为“囚犯困境”博弈,指双方或各方得失不等。在西方,这两大类博弈现已频繁地应用于外交决策、军备竞争、合作与冲突、和平与战争等重大国际问题的研究。
1702935016
1702935017
“谁是懦夫”博弈
1702935018
1702935019
1702935020
1702935021
1702935022
假设A和B两个人驾车在只有一个车道的公路上相对行驶,谁都不让路双方可能车毁人亡,但谁让路就成了“懦夫”。这样A和B就面临着四种行为选择:a1b1、a1b2、a2b1、a2b2。当然,对A来说,a2b1为最佳选择,可得+10;对B来说,则a1b2最佳,可得+10。但是双方都不能保证对方一定会让路,若自己不让路,对方也不让路,结果就是同归于尽。因此,对双方来说,最保险和最可靠的选择是a1b1,即双方让路,避免冲突。
1702935023
1702935024
冷战时期的美苏争夺格局就属此博弈规则。在大多数情况下,美苏强硬到一定程度后双方还是作出让步,避免正面的直接的军事冲突,选择a1b1为最佳方案,以求得危机的最后解决。但实际上美处攻势苏处劣势或相反的情况也屡屡发生,如1962年的古巴导弹危机,美苏之间在加勒比海形成严重的核对峙,双方剑拔弩张,达到一触即发的程度。由于当时美国拥有核优势,处于攻势,肯尼迪总统采取强硬立场,命令对古巴实行封锁,对苏联进行核讹诈,迫使赫鲁晓夫作出让步,从古巴撤回全部苏联导弹及有关设施,危机才随之解决。古巴导弹事件促使克里姆林宫下决心大力发展核武器,改变劣势,洗刷当“懦夫”的耻辱。果真到60年代末苏联就赶上了美国,使苏联在全球争夺中逐步地转为攻势。
1702935025
1702935026
在国际政治实践中,零和博弈强调冲突的可能性以及解决冲突的机制,诸如通过战备来防止敌国的入侵、组成同盟、核威慑等,由此给我们带来了一种错误的观念,即双方毫无共同利益可言,冲突是必然的,合作则少有可能。但事实表明,即使是在美苏严重对峙的情况下,双方也达成了外层空间条约(1967)、核不扩散条约(1968)等项协定。所以,英切里哥特指出,零和博弈只在特定的简单情况下才适用,如国际关系中的领土或资产纠纷,而一般来说,国际关系涉及的问题较为复杂,它们本质上属于非零和博弈,博弈各方互有得失的可能(80)。在非零和博弈中,各方收益的总和不等于零,参与者既存在着共同利益,又是一种竞争关系,它们既可能采取合作策略,也可能放弃合作。
1702935027
1702935028
“囚犯困境”博弈
1702935029
1702935030
1702935031
1702935032
1702935033
假设抓获了A和B两个嫌疑犯,将他俩分别关押、审讯,这样A和B就面临着四种选择和结局:a1b1、a1b2、a2b1、a2b2。当然,对A来说,a2b1为最佳选择,因为交代了只须关押3个月;对B来说,a1b2最佳,交代了也只须关押3个月。尽管对双方来说,a1b1选择最佳,各只判1年,但是太冒险,双方不能订攻守同盟,万一对方交代了,自己就要关押10年。因此,经过权衡,最后往往还是选择a2b2,即双方交代,这样较为保险。
1702935034
1702935035
长期以来美苏之间军备竞争的策略运用就体现了“囚犯困境”博弈原则。由于美苏双方缺乏信任,惟恐对方加强军备,使自己受挫,在国际舞台上的角逐中处于被动地位,所以权衡利弊后,双方自然会作出a2b2的战略抉择,发展军备,使裁军谈判成为步履艰辛的过程。
1702935036
1702935037
上述博弈的一个特点就是在对方采取不合作策略的情况下,一方的合作只会减少自己的收益,具有这种特点的博弈往往会产生对双方都不利的结局,或者说“合理的行动”却会产生“不利”的结果。那么,当这种博弈重复进行时,结果又会有什么变化呢?研究显示,在多次博弈的情况下,参与者可以通过观察对方所采取的策略和博弈的结果而获得某种信息,随着信息的传递,合作的可能性会增大。在一次性博弈中,由于各博弈方决策时只需考虑眼前利益,根据博弈中理性行为者利益最大化的原则,通常不能期望博弈方会考虑对方的利益得失,只要能实现自身的最大利益,博弈方是不惜相互“欺骗”乃至“伤害”的。在重复博弈中,各方关心的不是某一次博弈的结果或收益,而是博弈重复进行后的总体效果或平均收益,并且各次重复之间存在着相互影响和制约,所以要将它们作为一个完整的过程和整体来进行分析,要用动态博弈的方法加以研究。
1702935038
1702935039
但是,能够传达信息并不一定能保证实现合作。博弈方总是处在相互竞争的状态中,它们总想比别人赢得多而损失得少,即使采取合作也是为了更好地竞争。正如囚徒困境所表明的那样,违规者总是占尽便宜,真诚的合作似乎并不可取。为此,罗伯特·奥克塞罗德专门用计算机竞赛的方式对各项策略进行了测试,结果表明,胜利者的对策很简单的,即针锋相对(tit for tat)(81)。具体的办法是:(1)在开始几轮中采取合作;(2)只要对方善意相报,就坚持运用合作策略;(3)倘若对方采取不合作策略,就坚决予以回敬;(4)报复之后,不时作出一两次合作姿态,以给对方实行合作策略的机会。其中,行为者要有明确的目的,行为前后一致,从而使对方适应你的行为方式。当然,为了确保合作的顺利进行,双方必须签订具有约束力的协定,任何一方如有违约行为,就将受到严厉的处罚。处罚须大于违约所能得到的好处,否则,双方仍会时常采取不合作策略。
1702935040
1702935041
再来看一下多方的非零和博弈问题。这种博弈都有三个以上的参与者,其基本特征与两方博弈相似,博弈方都会根据对方的情况而寻求自身利益的最大化。不过由于独立决策者的增多,策略的相互依存关系也就更为复杂,策略的数目将按几何级数上升(2n)。三方博弈还可以用两个或多个矩阵来表示收益情况,但多于三方的博弈一般无法用矩阵形式表示。
1702935042
1702935043
此外,与两方博弈有根本不同的是多方博弈中可能出现“破坏者”,所谓破坏者是指自身的策略选择对其利益没有什么影响或影响不大,但却会影响其他博弈方的收益,有时这种影响甚至有决定性的作用。实际上,当一场博弈有若干参与者时,很自然会出现两个以上参与者结成联盟去反对其他方的情况,当然其中有些联盟者只是处于附属地位,他们单独的影响可能不大,但却有助于联盟实力的增强。这种情况进而会促使其他参与者起而仿效,以便确保他们的生存并获得最大限度的收益。有时,规则可能鼓励参与者在博弈开始前就组成联盟;有时他们只在对局开始后才暗中或公开地组成联盟。如果出现两个联合体,迫使所有的参与者投靠一方或另一方,那么这场博弈实际上就变成了一场两方零和博弈。然而可以想象,当博弈进行到某一阶段,也许会出现三个联合体,而且其中一个联合体最终会感到一种压力,必须同其他两个联盟中的一个结合。看来关键的问题在于怎样才能合理地分配战利品,使所有盟友感到满意。
1702935044
1702935045
三、国际关系中的“博弈”
[
上一页 ]
[ :1.702934996e+09 ]
[
下一页 ]