1704639650
博弈论通常被认为是从诺依曼与摩根斯坦(Von Neumann与Morgenstern)1944年发表的《博弈论与经济行为》一书开始的。尽管那部著作与现今的博弈论关系已不密切了,然而,那本书毕竟是引入了这样的思想,即人们之间的冲突是可以进行数学分析的,并且,诺依曼与摩根斯坦是为进行这种分析贡献了若干术语的。后来,塔克(Tucker)贡献了著名的“囚犯的困境”,纳什(Nash)在1950年与1951年给出了博弈均衡的定义(这是有别于市场均衡定义的定义),并给出了博弈均衡存在性的证明,从而奠定了现代非协同博弈论的基础。与此同时,协同博弈理论由纳什在1950年的另一篇论文与夏皮莱(Shapley)1953年关于谈判的论文中得到了发展,吉尔斯(Gilles)在1953年的一篇论文中把协同博弈引入一般均衡理论,导致了核(core)理论的诞生。
1704639651
1704639652
现在经济学常用的博弈理论工具早在50年代中期之前就已锻造出来了,只不过在70年代中期之前,博弈论只停留在自己的领域内而很少与主流经济学相联系。60年代,以迪布鲁(Debreu)与斯卡夫(Scarf)为代表的一些经济学家曾讨论过博弈中的核与经济中的一般均衡之间的关系。
1704639653
1704639654
进入70年代以来,经济学分析的重心由一般均衡转向对市场上理性的但拥有有限信息的个人行为的分析。这时,经济学家发现,个人之间采取行动的时间顺序是不协同的。对这种不协同的,受有限信息制约的个人行为的分析,使经济学家们打开了60年代博弈论的工具箱,其中有泽尔腾(Selten)1965年关于“完全性”的论文,有哈萨尼(Harsanyi)1967年与1968年关于不完全信息的论文,有泽尔腾(1975年)与克虏帕斯(Kreps)与威尔逊(Wilson)(1982年)关于序列均衡的论文,有克虏帕斯、缪尔格拉姆(Milgrom)、罗伯茨(Roberts)与威尔逊1982年关于重复博弈的论文。我们关于博弈论的三讲,主要是介绍1975年以后的内容。
1704639655
1704639657
第一节 基本概念
1704639658
1704639659
在一个博弈里,基本要素为:游戏者(players)、行动(actions)、信息(informations)、策略(strategies)、收益(payoffs)、结果(outcomes)与均衡(equilibrium)。我们来一一加以介绍。
1704639660
1704639661
一、游戏者
1704639662
1704639663
【定义】 游戏者:博弈里的游戏者是作决策的个人。每个游戏者的目标是通过选择行动使自己的效用极大化。
1704639664
1704639665
我们以石油输出国组织OPEC为例。沙特阿拉伯知道科威特的石油产量是以科威特对沙特的石油产量的预测为基础,这两国的产量共同决定石油的世界价格。这里,沙特与科威特都扮演了游戏者的角式。被动的个人,像中国百姓在油价变化之后对石油需求做出的反应并不能改变任何人的行为,这就不能称为是游戏者,只能作为博弈的参数。有时,在博弈中需明确定义“非游戏者”,非游戏者是指其行动是按纯机械方式而采取的。“宇宙”是一个“非游戏者”,因在博弈里,宇宙在某一特定的点上按特定的概率“采取”随机的“行动”,使某一结果发生。
1704639666
1704639667
在OPEC模型里,对于石油的世界性需求,被记为D,可以采取“强”或“弱”两个参数值,而假定这两个参数值是由宇宙选择(不究其发生原因):其发生的概率分别为70%与30%。即使游戏者们一直采取相同的行动,宇宙这类随机决定也会影响博弈格局的实现。这即是说,宇宙的随机变动是会决定博弈的实现的。
1704639668
1704639669
二、定义(行动或步骤)
1704639670
1704639671
一个游戏者i所采取的行动(action)或步骤(move),记为ai,是该游戏者可以做出的选择。
1704639672
1704639673
【定义】 行动集:游戏者i的行动集(action set),记为Ai={ai},是该游戏者可能采取的全部行动之集合。
1704639674
1704639675
【定义】 行动组合:一个行动组合是一个有序集a={ai}(i=1,2,…,n),是由一个博弈中n个游戏者各取一个行动而组合成的。
1704639676
1704639677
注意,行动组合实际上是博弈中的某一个解。即n个参与者在某一时刻碰面时各出一张牌而构成的一个格局。
1704639678
1704639679
三、定义(游戏的顺序(order of play))
1704639680
1704639681
游戏的顺序是指在什么时候该谁下棋?游戏的次序可分为“同时”(simultaneously)与“序列”(sequential)。“同时”是指游戏者同时决定自己的行动,“序列”顺序得明确规定谁先行,谁后走。
1704639682
1704639683
四、定义(信息集(information set))
1704639684
1704639685
信息集是游戏者在博弈的某一特定时点上关于不同变量的取值的全部知识之和。如果游戏者在该时点上考虑的是若干个变量,则游戏者认为可能出现的每个变量的若干种可能值都属于信息集的要素。
1704639686
1704639687
五、定义(游戏者的策略(player’s strategy))
1704639688
1704639689
游戏者的策略是指在博弈的每一环上,游戏者的行事规则,即按什么规则到行动集中去选择行动。
1704639690
1704639691
注意,策略不等同于行动。策略是指,如果出现了什么情况,如果对手采取了什么行动,那么,我该采取什么行动。
1704639692
1704639693
【定义】 游戏者的策略集或策略空间(player’s strategy set or strategy space):si={si}是游戏者i所有策略的集合。
1704639694
1704639695
【定义】 策略组合(strategy combination):记为s=(s1,s2,…,sn),这是指,如果有n个游戏者参与了一个博弈,那么,每个游戏者只取一个策略,n个策略的拼盘就构成一个特定的策略组合。
1704639696
1704639697
例如,在石油输出国组织里,沙特(s)在1998年的石油产量Qs,8,取决于世界市场对石油的需求(D),又取决于自己上一年的石油产量Qs,7,还取决于当年的竞争对手(others)的石油产量Qo,8。这样,沙特在石油产量的博弈里的行动,是“产量高”(H),与“产量低”(L),但其策略集为
1704639698
1704639699
[
上一页 ]
[ :1.70463965e+09 ]
[
下一页 ]