1704418448
1704418449
1704418451
博弈论基础 第2章 完全信息动态博弈
1704418452
1704418453
本章介绍动态博弈。我们仍集中分析完全信息的博弈(即参与者的收益函数是共同知识的博弈);有关非完全信息的博弈将在第3章介绍。其中第2.1节分析完全且完美信息的动态博弈,这是指在博弈进行的每一步当中,要选择行动的参与者都知道这一步之前博弈进行的整个过程。从第2.2节到第2.4节,我们讨论完全但不完美信息博弈:在博弈的某些阶段,要选择行动的参与人并不知道在这一步之前博弈进行的整个过程。
1704418454
1704418455
所有动态博弈的中心问题是可信任性。作为不可置信的威胁的一个例子,考虑下面两步博弈。第一,参与者1选择支付1000美元钱给参与者2还是一分不给;第二,参与者2观察参与者1的选择,然后决定是否引爆一颗手雷把两人一块儿炸死。假设参与者2威胁参与者1,如果他不付1000美元就引爆手雷,如果参与者1相信这一威胁,他的最优反应是支付1000美元,但参与者1却不会对这一威胁信以为真,因为它不可置信:如果给参与者2一个机会,让他把威胁付诸实施,参与者2也不会选择去实施它,这样参与者1就会一分不付。[1]
1704418456
1704418457
第2.1节分析如下类型完全且完美信息的动态博弈:首先参与者1行动,参与者2先观察到参与者1的行动,然后参与者2行动,博弈结束。手雷博弈即属这一类型,斯塔克尔贝里(1934)的双头垄断模型,里昂惕夫(Leontief,1946)的有工会企业中的工资和就业决定模型亦属这一类博弈。我们定义此类博弈的逆向归纳解(backwards-induction outcome)并简要讨论它与纳什均衡的关系(这一关系的详细讨论在第2.4节)。作为例子,我们解出在斯塔克尔贝里和里昂惕夫模型中的逆向归纳解,并对鲁宾斯坦(Ru-binstein,1982)的讨价还价模型推导出相似的结果,尽管后面的博弈有潜在无穷多步的行动,因此并不属于以上类型的博弈。
1704418458
1704418459
第2.2节丰富了前一节分析的博弈类型:首先参与者1和2同时行动,接着参与者3和4观察到1和2选择的行动,然后参与者3和4同时行动,博弈结束。这里的同时行动意味着此类博弈有不完美信息(这一点在第2.4节将进一步给出解释)。我们定义这种博弈的子博弈精炼解(subgame-perfect outcome),它是逆向归纳方法在此类博弈中的自然延伸。在应用举例中,将解出戴蒙德和迪布维格(Diamond&Dybvig,1983)的银行挤提模型、拉齐尔和罗森(Lazear&Rosen,1981)的锦标赛模型的结果。
1704418460
1704418461
第2.3节研究重复博弈(repeated game),它指一组固定的参与者多次重复进行同一给定的博弈,并且在下次博弈开始前,参与者都可以观察到前面所有博弈的结果。这里分析的中心问题是(可信的)威胁和对以后行为所做的承诺可以影响到当前的行为。我们给出重复博弈中子博弈精炼纳什均衡的定义,并将其与第2.1节中的逆向归纳解和第2.2节中子博弈精炼解联系起来,还将给出无限次重复博弈中的无名氏定理(Folk Theorem)及其证明。在应用举例中,将分析弗里德曼(1971)的古诺双头垄断企业相互串谋模型,夏皮罗和施蒂格利茨(Shapiro&Stiglitz,1984)的货币政策模型。
1704418462
1704418463
第2.4节我们介绍分析一般的完全信息动态博弈所需要的工具,不再区分信息是否是完美的。我们定义博弈的扩展式表述并将其与第一章介绍的标准式表述相互联系起来,同时定义一般博弈中的子博弈精炼纳什均衡。本节和本章的重点都在于,一个完全信息动态博弈可能会有多个纳什均衡,但其中一些均衡也许包含了不可置信的威胁或承诺,子博弈精炼纳什均衡则是通过了可信性检验的均衡。
1704418464
1704418465
1704418466
1704418467
1704418469
博弈论基础 2.1 完全且完美信息动态博弈
1704418470
1704418472
2.1.A 理论:逆向归纳法
1704418473
1704418474
手雷博弈属于下面简单类型的完全且完美信息动态博弈:
1704418475
1704418476
1.参与者1从可行集A1中选择一个行动a1,
1704418477
1704418478
2.参与者2观察到之后从可行集A2中选择一个行动a2,
1704418479
1704418480
3.两人的收益分别为u1(a1,a2)和u2(a1,a2)。
1704418481
1704418482
许多经济问题都符合这种博弈,[2]其中的两个例子(后面将进行详细讨论)是斯塔克尔贝里的双头垄断模型和里昂惕夫的有工会企业工资和就业模型。其他的经济问题可通过允许更长的行动序列建立模型:或者加入更多的参与者,或者允许参与者有多步行动(在第2.1.1节讨论的鲁宾斯坦的讨价还价模型就是后者的一个例子)。完全且完美信息动态博弈的主要特点是:(i)行动是顺序发生的,(ii)下一步行动选择之前,所有以前的行动都可被观察到,及(iii)每一可能的行动组合下参与者的收益都是共同知识。
1704418483
1704418484
我们可以通过逆向归纳法求解此类博弈问题,方法如下。当在博弈的第二阶段参与者2行动时,由于其前参与者1已选择行动a1,他面临的决策问题可用下式表示:
1704418485
1704418486
1704418487
1704418488
1704418489
假定对A1中的每一个a1,参与者2的最优化问题只有惟一解,用R2(a1)表示,这就是参与者2对参与者1的行动的反应(或最优反应)。由于参与者1能够和参与者2一样解出2的问题,参与者1可以预测到参与者2对1每一个可能的行动a1所作出的反应,这样1在第一阶段要解决的问题可归结为:
1704418490
1704418491
1704418492
1704418493
1704418494
假定参与者1的这一最优化问题同样有惟一解,表示为a1*,我们称(a1*,R2(a1*))是这一博弈的逆向归纳解。逆向归纳解不含有不可置信的威胁:参与者1预测参与者2将对1可能选择的任何行动a1做出最优反应,选择行动R2(a1);这一预测排除了参与者2不可置信的威胁,即参与者2将在第二阶段到来时做出不符合自身利益的反应。
1704418495
1704418496
在第一章中我们用标准式表述研究完全信息静态博弈,并作为这种博弈的解的概念,重点讨论了纳什均衡。不过在本节对动态博弈的讨论中,我们既不涉及标准式表述,亦不提及纳什均衡;分别代之以(1)—(3)中对博弈的文字描述和已定义的逆向归纳解。在第2.4.A节中,为了使概念更精确,我们将定义子博弈精炼纳什均衡为:只有不包含不可置信的威胁的纳什均衡才是子博弈精炼纳什均衡,我们会发现一个属于(1)—(3)所界定的博弈可能会有多个纳什均衡,但惟一的子博弈精炼纳什均衡就是与逆向归纳解相对应的均衡。正如我们在第1.1.C节中所观察到的,有些博弈会有多个纳什均衡,但有一个均衡明显占优,成为博弈的解。
1704418497
[
上一页 ]
[ :1.704418448e+09 ]
[
下一页 ]