1704418462
1704418463
第2.4节我们介绍分析一般的完全信息动态博弈所需要的工具,不再区分信息是否是完美的。我们定义博弈的扩展式表述并将其与第一章介绍的标准式表述相互联系起来,同时定义一般博弈中的子博弈精炼纳什均衡。本节和本章的重点都在于,一个完全信息动态博弈可能会有多个纳什均衡,但其中一些均衡也许包含了不可置信的威胁或承诺,子博弈精炼纳什均衡则是通过了可信性检验的均衡。
1704418464
1704418465
1704418466
1704418467
1704418469
博弈论基础 2.1 完全且完美信息动态博弈
1704418470
1704418472
2.1.A 理论:逆向归纳法
1704418473
1704418474
手雷博弈属于下面简单类型的完全且完美信息动态博弈:
1704418475
1704418476
1.参与者1从可行集A1中选择一个行动a1,
1704418477
1704418478
2.参与者2观察到之后从可行集A2中选择一个行动a2,
1704418479
1704418480
3.两人的收益分别为u1(a1,a2)和u2(a1,a2)。
1704418481
1704418482
许多经济问题都符合这种博弈,[2]其中的两个例子(后面将进行详细讨论)是斯塔克尔贝里的双头垄断模型和里昂惕夫的有工会企业工资和就业模型。其他的经济问题可通过允许更长的行动序列建立模型:或者加入更多的参与者,或者允许参与者有多步行动(在第2.1.1节讨论的鲁宾斯坦的讨价还价模型就是后者的一个例子)。完全且完美信息动态博弈的主要特点是:(i)行动是顺序发生的,(ii)下一步行动选择之前,所有以前的行动都可被观察到,及(iii)每一可能的行动组合下参与者的收益都是共同知识。
1704418483
1704418484
我们可以通过逆向归纳法求解此类博弈问题,方法如下。当在博弈的第二阶段参与者2行动时,由于其前参与者1已选择行动a1,他面临的决策问题可用下式表示:
1704418485
1704418486
1704418487
1704418488
1704418489
假定对A1中的每一个a1,参与者2的最优化问题只有惟一解,用R2(a1)表示,这就是参与者2对参与者1的行动的反应(或最优反应)。由于参与者1能够和参与者2一样解出2的问题,参与者1可以预测到参与者2对1每一个可能的行动a1所作出的反应,这样1在第一阶段要解决的问题可归结为:
1704418490
1704418491
1704418492
1704418493
1704418494
假定参与者1的这一最优化问题同样有惟一解,表示为a1*,我们称(a1*,R2(a1*))是这一博弈的逆向归纳解。逆向归纳解不含有不可置信的威胁:参与者1预测参与者2将对1可能选择的任何行动a1做出最优反应,选择行动R2(a1);这一预测排除了参与者2不可置信的威胁,即参与者2将在第二阶段到来时做出不符合自身利益的反应。
1704418495
1704418496
在第一章中我们用标准式表述研究完全信息静态博弈,并作为这种博弈的解的概念,重点讨论了纳什均衡。不过在本节对动态博弈的讨论中,我们既不涉及标准式表述,亦不提及纳什均衡;分别代之以(1)—(3)中对博弈的文字描述和已定义的逆向归纳解。在第2.4.A节中,为了使概念更精确,我们将定义子博弈精炼纳什均衡为:只有不包含不可置信的威胁的纳什均衡才是子博弈精炼纳什均衡,我们会发现一个属于(1)—(3)所界定的博弈可能会有多个纳什均衡,但惟一的子博弈精炼纳什均衡就是与逆向归纳解相对应的均衡。正如我们在第1.1.C节中所观察到的,有些博弈会有多个纳什均衡,但有一个均衡明显占优,成为博弈的解。
1704418497
1704418498
本节的最后,我们探讨逆向归纳法背后的理性假定。考虑下面的三步博弈,其中参与者1有两次行动:
1704418499
1704418500
1.参与者1选择L或R,其中L使博弈结束,参与者1的收益为2,参与者2的收益为0;
1704418501
1704418502
2.参与者2观测参与者1的选择,如果1选择R,则2选择L’或R’,其中L’使博弈结束,两人的收益均为1;
1704418503
1704418504
3.参与者1观测2的选择(并且回忆在第一阶段时自己的选择)。如果前两阶段的选择分别为R和R’,则1可选择L”或R”,每一选择都将结束博弈,L”时参与者1的收益为3,2的收益为0,如选R”,两人的收益分别为0和2。
1704418505
1704418506
上面的语言描述可以用如下简明的博弈树表示(这是博弈的扩展式表述,我们将在第2.4节进行更一般的讨论)。博弈树上每一枝的末端都有两个收益值,上面代表参与者1的收益,下面代表参与者2的收益。
1704418507
1704418508
1704418509
1704418510
1704418511
为计算出这一博弈的逆向归纳解,我们从第三阶段(即参与者1的第二次行动)开始。这里参与者1面临的选择是:L”可得收益3,R”可得收益0,于是L”是最优的。那么在第二阶段,参与者2预测到一旦博弈进入到第三阶段,则参与者1会选择,这会使2的收益为0,从而参与者2在第二阶段的选择为:L’可得收益1,R”可得收益0,于是L’是最优的。这样,在第一阶段,参与者1预测到如果博弈进入到第二阶段,2将选择L’,使参与者1的收益为1,从而参与者1在第一阶段的选择是:L收益为2,R收益为1,于是L是最优的。
[
上一页 ]
[ :1.704418462e+09 ]
[
下一页 ]