打字猴:1.704419443e+09

1704419443

1704419444

1704419445

1704419446

1704419447

1704419448

1704419449

1704419450 在这样的博弈中，行动即为参与者1的一个战略，因为参与者1只可能在一种情况下选择行动——即在博弈刚开始，不过对参与者2，却只是一个行动（具体地说，是对的最优反应），而并非一个战略，因为参与者2的一个战略必须包含针对1在第一阶段每个可能的行动，参与者2将采取的行动。从而，参与者2的最优反应函数R2（a1）是其一个战略。在此类博弈中，子博弈始于（并只包含）参与者2在第二阶段的行动。对参与者1的每一个可能行动a1属于A1都存在一个子博弈，从而为证明是一个子博弈精炼纳什均衡，我们必须证明是一个纳什均衡，并且参与者的战略在每一个子博弈中都构成一个纳什均衡。由于子博弈都只是单人决策问题，后一问题就可简单化为要求参与者2的行动在每一子博弈中都是最优的，它又正是参与者2的最优反应函数R2（a1）所解决的问题。最后，是一个纳什均衡，因为参与者的战略互为最优反应：a*是R2（a1）的最优反应，即令u1（a1R2（a1））最大化，并且R2（a1）为a*的最优反应，即令最大化。

1704419451

1704419452 对第2.2.A节分析的博弈，其论证过程是相似的，所以我们只进行简要的讨论。

1704419453

1704419454

1704419455

1704419456 定义在第2.2.A节定义的完全非完美信息两阶段博弈中，子博弈精炼解为，但子博弈精炼纳什均衡为。

1704419457

1704419458

1704419459

1704419460

1704419461

1704419462 在这一博弈中，行动组合只是参与者3和4之间一个子博弈的纳什均衡，（具体地说，是参与者1和2选定战略后其余部分的博弈）而却分别为参与者3和参与者4的一个战略——针对参与者1和2每一可能行动组合作出反应的完整行动计划。在这一博弈中，子博弈是在给定参与者1和2在第一阶段的行动后，第二阶段参与者3和4之间的博弈，正如子博弈精炼纳什均衡所要求的，战略组合在每一个子博弈中都构成了纳什均衡。

1704419463

1704419464 为总结本节（以及本章）的内容，我们用下面的例子说明本章的主要思想：子博弈精炼剔除了基于不可置信的威胁或承诺之上的纳什均衡。请回顾图2.4.1中的扩展式博弈，如果我们在第2.1.A节遇到这一博弈，我们就会用逆向归纳法求解如下。如果参与者2到达参与者1选择L之后的决策节，则2的最优反应为选择R’（可得到的收益为2），而不是选择L’（只能得到1的收益）。如果2到达参与者1选择R之下的决策节，则2的最优反应为选择L’（可获得的收益为1），而不是R’（可得到的收益为0）。由于参与者1能和参与者2一样解出2的最优选择，1在第一阶段的问题就可归结为在L（将会令参与者2选择R’，从而使1的收益为1）和R（将会使参与者2选择L’，从而使1的收益为2）之间进行选择。从而，参与者1对预期的2的行动的最优反应是在第一阶段选择R，于是博弈的逆向归纳解为（R，L’），如在图2.4.5中用粗线表示出的始于参与者1决策节的路径。图中另外还有一条粗线始自参与者1选择L之后的参与者2的决策节，博弈树中的这种不完全路径表明，如果博弈到达参与者2的这一决策节，参与者2将会选择R’。

1704419465

1704419466

1704419467

1704419468

1704419469 图2.4.5

1704419470

1704419471 我们已讲过，同一博弈的标准式表述由图2.4.2给出。如果我们在第1.1.C节中遇到这么一个标准式博弈，我们将会解出其（纯战略）纳什均衡，它们为（R，（R’，L’））和（L，（R’，R’））下面我们来比较从图2.4.2中解出的这两个纳什均衡与图2.4.5中根据扩展式逆向归纳法导出的结果：标准式表述中的纳什均衡（R，（R’，L’））对应了图2.4.5中的所有粗线路径。在第2.1.A节我们称（R，L’）为博弈的逆向归纳解，因此也可以十分自然地称（R，（R’，L’））为博弈的逆向归纳纳什均衡，但我们用较为专业性的名词称之为子博弈精炼纳什均衡。一个解和一个均衡的区别，在于解特指始于博弈的第一个决策节并终于终点节的惟一的粗线路径，而均衡同时还包含了另外的始自1选择L之后2的决策节的粗体线路径，这也就是说，均衡包含了参与者2的一个完整的战略。

1704419472

1704419473 但另一个纳什均衡（R，（R’，L’））又有什么特点呢？在这一均衡中，参与者2的战略是不仅在参与者1选择L时选择R’（这一条和第一个纳什均衡是相同的），而且当参与者1选择R时仍选择R’。因为（在R之后的）R’将使参与者1的收益为0，参与者1对参与者2这一战略的最优反应将是选择L，以使参与者1的收益达到1（在参与者2选择R’之后），至少优于一无所获。用不太严格却更为形象的话讲，我们可以说参与者2威胁如果参与者1选择R，他将选择R’（严格地讲，在1选择行动之前，2并没有机会作出这一威胁，如果有，它将已经包含在扩展式之中了）。如果这一威胁起作用了（即1选择了L）则2就没有机会实践他的威胁，不过这一威胁也不会起作用，因为它是不可信的：如果参与者2被给予机会实施他的威胁（即如果1的确选择了R），则参与者2将会决定选择L’，而不会是R’。更正式一点儿说，纳什均衡（L，（R’，R’））不是子博弈精炼的，因为参与者的战略在其中的一个子博弈中没有构成纳什均衡。具体地说，参与者2的选择R’在始自（并完全由其组成）参与者1选择R之后参与者2的决策节的子博弈中不是最优的。

1704419474

1704419475 在一个完全且完美信息博弈中，逆向归纳法可剔除不可信威胁。由于每一个信息集都是单节的，博弈树上每个决策节都分别代表了参与者可能会遇到，并需作出反应的情况。从而在扩展式中，通过每个决策节逐级逆向归纳求解的程序，也就可以看成迫使每个参与者考虑实施他可能作出的每一个威胁。但是，在一个非完美信息博弈中，问题就不那么简单了，因为这种博弈包含了至少一个非单节的信息集。我们也可以试着用相同的方法，在扩展式中通过逆推求解，总是会到达某个处于非单节信息集内的决策节。但如果博弈真的到达了这个决策节，强迫参与者考虑如何行动，并不等于让其考虑在一个可能发生的情况下他将如何行动，因为如果博弈真的进行到了这个信息集，应该行动的参与者并无法知道是否到达了这个决策节，正是由于此决策节包含在一个非单节的信息集中。

1704419476

1704419477 在逆向归纳法中，解决由非单节信息集引起的问题的方法之一，是在扩展式中从后往前逆推求解，直到遇到一个非单节信息集，先暂时不要管它，径直越过该信息集向上，直到到达一个单节信息集。然后，不仅要考虑在这个单节信息集行动的参与者在到达此决策节时如何选择，还要同时分析在刚刚被越过的非单节信息集行动的参与者将会如何选择。一般来说，这一程序最后可得到子博弈精炼纳什均衡。解决上述问题的另一种方法，是先在扩展式中运用逆向归纳的方法，直到遇上了一个非单节信息集，然后强迫在该信息集行动的参与者考虑如果到达了这一信息集将如何选择（要做到这一点，必须要求该参与者对到达了同一信息集中哪一个决策节有一个概率上的判断。这样的判断当然又要依赖于各参与者在博弈树的更上方可能的行动，所以，运用这一方法，只对博弈树从下往上逆推一遍是无法得到结果的）。一般而言，这一程序可以得到一个精炼贝叶斯均衡，参见第4章。

1704419478

1704419479

1704419480

1704419481

1704419482 博弈论基础 [:1704417414]

1704419483 博弈论基础 2.5 进一步阅读

1704419484

1704419485 第2.1节关于没有工会组织企业的工资和就业，参见埃斯皮诺萨和里（1989，习题2.10）给出的重复谈判模型，以及施泰格（Staiger，1991）给出的单一谈判模型，其中企业可以选择是就工资和就业同时谈判还是只就工资进行谈判。关于序贯谈判，参见费尔南德斯和格莱泽（Fernandez&Glazer，1991）给出的企业和工会间讨价还价的鲁宾斯坦式模型，在原模型的基础上又增加了新的特点，即工会必须决定如果要价被任何一方拒绝，是否要继续进行罢工，这种条件下存在多个有效率的子博弈精炼均衡，同时又支持无效率的均衡（即含有罢工的均衡），即使信息是完全的。奥斯本（Osborne）和鲁宾斯坦（1990）的专著里概括总结了许多博弈理论的讨价还价模型，并将它们与纳什关于讨价还价的公理式方法相联系，并把讨价还价模型看成是市场理论的基石之一。

1704419486

1704419487 第2.2节关于银行挤提，参见杰克林和巴塔查里亚（Jacklin&Bhattacharya，1988）。麦克米伦（McMillan，1986）的著作中概括分析了博弈论在国际经济学领域的早期应用；参见布龙和罗戈夫（Bulon&Rogoff，1989）关于债务危机的最新研究成果。关于工作竞赛，参见拉齐尔（1989，习题2.8）的模型，其中工人既可以提高自己的产量，同时又可以搞破坏，降低他人的产量；罗森（1986）讨论了一系列工作竞赛的情况，其中一个回合的失败者将不再参加以下回合的竞赛，并求得为维持激励而必须的代价。

1704419488

1704419489 第2.3节贝努瓦和克里希纳（1985）分析了有限重复博弈。关于重新谈判，参见贝努瓦和克里希纳（1989）对有限重复博弈的讨论，以及法雷尔和马斯金（1989）对无限重复博弈的分析和对有关文献的综述。泰勒尔（1988，第6章）总述了动态的寡头垄断模型。阿克尔洛夫和叶林（Akerlof&Yellen，1986）的论文集收集了关于效率工资方面的许多重要论文，并提供了一个整体上的介绍。关于货币政策，鲍尔（Ball，1990）对现存的不同风格模型的前提及分析做了回顾和总结，并给出了一个解释通货膨胀时间路径的模型。

1704419490

1704419491 第2.4节克雷普斯和威尔逊（1982）关于博弈扩展式的正式分析；克雷普斯（1990）还给出了更容易理解的文字表述。

1704419492

[ 上一页 ] [ :1.704419443e+09 ] [ 下一页 ]