打字猴:1.704418472e+09
1704418472 2.1.A 理论:逆向归纳法
1704418473
1704418474 手雷博弈属于下面简单类型的完全且完美信息动态博弈:
1704418475
1704418476 1.参与者1从可行集A1中选择一个行动a1,
1704418477
1704418478 2.参与者2观察到之后从可行集A2中选择一个行动a2,
1704418479
1704418480 3.两人的收益分别为u1(a1,a2)和u2(a1,a2)。
1704418481
1704418482 许多经济问题都符合这种博弈,[2]其中的两个例子(后面将进行详细讨论)是斯塔克尔贝里的双头垄断模型和里昂惕夫的有工会企业工资和就业模型。其他的经济问题可通过允许更长的行动序列建立模型:或者加入更多的参与者,或者允许参与者有多步行动(在第2.1.1节讨论的鲁宾斯坦的讨价还价模型就是后者的一个例子)。完全且完美信息动态博弈的主要特点是:(i)行动是顺序发生的,(ii)下一步行动选择之前,所有以前的行动都可被观察到,及(iii)每一可能的行动组合下参与者的收益都是共同知识。
1704418483
1704418484 我们可以通过逆向归纳法求解此类博弈问题,方法如下。当在博弈的第二阶段参与者2行动时,由于其前参与者1已选择行动a1,他面临的决策问题可用下式表示:
1704418485
1704418486
1704418487
1704418488
1704418489 假定对A1中的每一个a1,参与者2的最优化问题只有惟一解,用R2(a1)表示,这就是参与者2对参与者1的行动的反应(或最优反应)。由于参与者1能够和参与者2一样解出2的问题,参与者1可以预测到参与者2对1每一个可能的行动a1所作出的反应,这样1在第一阶段要解决的问题可归结为:
1704418490
1704418491
1704418492
1704418493
1704418494 假定参与者1的这一最优化问题同样有惟一解,表示为a1*,我们称(a1*,R2(a1*))是这一博弈的逆向归纳解。逆向归纳解不含有不可置信的威胁:参与者1预测参与者2将对1可能选择的任何行动a1做出最优反应,选择行动R2(a1);这一预测排除了参与者2不可置信的威胁,即参与者2将在第二阶段到来时做出不符合自身利益的反应。
1704418495
1704418496 在第一章中我们用标准式表述研究完全信息静态博弈,并作为这种博弈的解的概念,重点讨论了纳什均衡。不过在本节对动态博弈的讨论中,我们既不涉及标准式表述,亦不提及纳什均衡;分别代之以(1)—(3)中对博弈的文字描述和已定义的逆向归纳解。在第2.4.A节中,为了使概念更精确,我们将定义子博弈精炼纳什均衡为:只有不包含不可置信的威胁的纳什均衡才是子博弈精炼纳什均衡,我们会发现一个属于(1)—(3)所界定的博弈可能会有多个纳什均衡,但惟一的子博弈精炼纳什均衡就是与逆向归纳解相对应的均衡。正如我们在第1.1.C节中所观察到的,有些博弈会有多个纳什均衡,但有一个均衡明显占优,成为博弈的解。
1704418497
1704418498 本节的最后,我们探讨逆向归纳法背后的理性假定。考虑下面的三步博弈,其中参与者1有两次行动:
1704418499
1704418500 1.参与者1选择L或R,其中L使博弈结束,参与者1的收益为2,参与者2的收益为0;
1704418501
1704418502 2.参与者2观测参与者1的选择,如果1选择R,则2选择L’或R’,其中L’使博弈结束,两人的收益均为1;
1704418503
1704418504 3.参与者1观测2的选择(并且回忆在第一阶段时自己的选择)。如果前两阶段的选择分别为R和R’,则1可选择L”或R”,每一选择都将结束博弈,L”时参与者1的收益为3,2的收益为0,如选R”,两人的收益分别为0和2。
1704418505
1704418506 上面的语言描述可以用如下简明的博弈树表示(这是博弈的扩展式表述,我们将在第2.4节进行更一般的讨论)。博弈树上每一枝的末端都有两个收益值,上面代表参与者1的收益,下面代表参与者2的收益。
1704418507
1704418508
1704418509
1704418510
1704418511 为计算出这一博弈的逆向归纳解,我们从第三阶段(即参与者1的第二次行动)开始。这里参与者1面临的选择是:L”可得收益3,R”可得收益0,于是L”是最优的。那么在第二阶段,参与者2预测到一旦博弈进入到第三阶段,则参与者1会选择,这会使2的收益为0,从而参与者2在第二阶段的选择为:L’可得收益1,R”可得收益0,于是L’是最优的。这样,在第一阶段,参与者1预测到如果博弈进入到第二阶段,2将选择L’,使参与者1的收益为1,从而参与者1在第一阶段的选择是:L收益为2,R收益为1,于是L是最优的。
1704418512
1704418513 上述过程求出博弈的逆向归纳解为,参与者1在第一阶段选择L,从而使博弈结束。即使逆向归纳预测博弈将在第一阶段结束,但论证过程的重要部分却是考虑如果博弈不在第一阶段结束时可能发生的情况。比如在第二阶段,当参与者2预测如果博弈进入第三阶段,则1会选择L”,这时2假定1是理性的。由于只有在1偏离了博弈的逆向归纳解,才能轮得到2选择行动,而这时2对1的理性假定便看似是矛盾的,即如果1在第一阶段选择了那么第二阶段2就不能再假定1是理性的了。但这种理解是不对的:如果1在第一阶段选择了R,则两个参与者都是理性的就不可能是共同知识,但这时1仍有理由在第一阶段选择R,却不与2对1的理性假定相矛盾。[3]一种可能是“参与者1是理性的”是共同知识,但“参与者2是理性的”却不是共同知识:如果1认为2可能不是理性的,则1就可能在第一阶段选择R,希望2在第二阶段选择R’,从而给1以机会在第三阶段选择L”。另一种可能是“参与者2是理性的”是共同知识,但“参与者1是理性的”却不是共同知识:如果1是理性的,但推测2可能认为1是非理性的,这时1也可能在第一阶段选择R,希望2会认为1是非理性的而在第二阶段选择R’,期望1能在第三阶段选择R”。逆向归纳中关于1在第一阶段选择R的假定可通过上面的情况得到解释。不过在有些博弈中,对1选择了R的更为合理的假定是1确实是非理性的。在这样的博弈中,逆向归纳在预测博弈进行方面就会失去其大部分作用,正像在博弈论不能提供惟一解并不能达成协议的博弈中,纳什均衡也对预测博弈的结果所助无几。
1704418514
1704418515 博弈论基础 [:1704417397]
1704418516 2.1.B 斯塔克尔贝里双头垄断模型
1704418517
1704418518 斯塔克尔贝里(1934)提出一个双头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后从属企业(追随者)行动。比如在美国汽车产业发展史中的某些阶段,通用汽车就扮演过这种领导者的角色(这一例子把模型直接扩展到允许不止一个追随企业,如福特、克莱斯勒等等)。根据斯塔克尔贝里的假定,模型中的企业选择其产量,这一点和古诺模型是一致的(只不过古诺模型中企业是同时行动的,不同于这里的序贯行动)。至于在类似于贝特兰德模型中企业(同时地)选择价格的假定下,如何构建相似的序贯行动模型,我们留作习题请读者自己练习。
1704418519
1704418520 博弈的时间顺序如下:(1)企业1选择产量q≥0;(2)企业2观测到q1,然后选择产量q2≥0;(3)企业i的收益由下面的利润函数给出
1704418521
[ 上一页 ]  [ :1.704418472e+09 ]  [ 下一页 ]