打字猴:1.704418462e+09

1704418462

1704418463 第2.4节我们介绍分析一般的完全信息动态博弈所需要的工具，不再区分信息是否是完美的。我们定义博弈的扩展式表述并将其与第一章介绍的标准式表述相互联系起来，同时定义一般博弈中的子博弈精炼纳什均衡。本节和本章的重点都在于，一个完全信息动态博弈可能会有多个纳什均衡，但其中一些均衡也许包含了不可置信的威胁或承诺，子博弈精炼纳什均衡则是通过了可信性检验的均衡。

1704418464

1704418465

1704418466

1704418467

1704418468 博弈论基础 [:1704417395]

1704418469 博弈论基础 2.1 完全且完美信息动态博弈

1704418470

1704418471 博弈论基础 [:1704417396]

1704418472 2.1.A 理论：逆向归纳法

1704418473

1704418474 手雷博弈属于下面简单类型的完全且完美信息动态博弈：

1704418475

1704418476 1.参与者1从可行集A1中选择一个行动a1，

1704418477

1704418478 2.参与者2观察到之后从可行集A2中选择一个行动a2，

1704418479

1704418480 3.两人的收益分别为u1（a1，a2）和u2（a1，a2）。

1704418481

1704418482 许多经济问题都符合这种博弈，[2]其中的两个例子（后面将进行详细讨论）是斯塔克尔贝里的双头垄断模型和里昂惕夫的有工会企业工资和就业模型。其他的经济问题可通过允许更长的行动序列建立模型：或者加入更多的参与者，或者允许参与者有多步行动（在第2.1.1节讨论的鲁宾斯坦的讨价还价模型就是后者的一个例子）。完全且完美信息动态博弈的主要特点是：（i）行动是顺序发生的，（ii）下一步行动选择之前，所有以前的行动都可被观察到，及（iii）每一可能的行动组合下参与者的收益都是共同知识。

1704418483

1704418484 我们可以通过逆向归纳法求解此类博弈问题，方法如下。当在博弈的第二阶段参与者2行动时，由于其前参与者1已选择行动a1，他面临的决策问题可用下式表示：

1704418485

1704418486

1704418487

1704418488

1704418489 假定对A1中的每一个a1，参与者2的最优化问题只有惟一解，用R2（a1）表示，这就是参与者2对参与者1的行动的反应（或最优反应）。由于参与者1能够和参与者2一样解出2的问题，参与者1可以预测到参与者2对1每一个可能的行动a1所作出的反应，这样1在第一阶段要解决的问题可归结为：

1704418490

1704418491

1704418492

1704418493

1704418494 假定参与者1的这一最优化问题同样有惟一解，表示为a1*，我们称（a1*，R2（a1*））是这一博弈的逆向归纳解。逆向归纳解不含有不可置信的威胁：参与者1预测参与者2将对1可能选择的任何行动a1做出最优反应，选择行动R2（a1）；这一预测排除了参与者2不可置信的威胁，即参与者2将在第二阶段到来时做出不符合自身利益的反应。

1704418495

1704418496 在第一章中我们用标准式表述研究完全信息静态博弈，并作为这种博弈的解的概念，重点讨论了纳什均衡。不过在本节对动态博弈的讨论中，我们既不涉及标准式表述，亦不提及纳什均衡；分别代之以（1）—（3）中对博弈的文字描述和已定义的逆向归纳解。在第2.4.A节中，为了使概念更精确，我们将定义子博弈精炼纳什均衡为：只有不包含不可置信的威胁的纳什均衡才是子博弈精炼纳什均衡，我们会发现一个属于（1）—（3）所界定的博弈可能会有多个纳什均衡，但惟一的子博弈精炼纳什均衡就是与逆向归纳解相对应的均衡。正如我们在第1.1.C节中所观察到的，有些博弈会有多个纳什均衡，但有一个均衡明显占优，成为博弈的解。

1704418497

1704418498 本节的最后，我们探讨逆向归纳法背后的理性假定。考虑下面的三步博弈，其中参与者1有两次行动：

1704418499

1704418500 1.参与者1选择L或R，其中L使博弈结束，参与者1的收益为2，参与者2的收益为0；

1704418501

1704418502 2.参与者2观测参与者1的选择，如果1选择R，则2选择L’或R’，其中L’使博弈结束，两人的收益均为1；

1704418503

1704418504 3.参与者1观测2的选择（并且回忆在第一阶段时自己的选择）。如果前两阶段的选择分别为R和R’，则1可选择L”或R”，每一选择都将结束博弈，L”时参与者1的收益为3，2的收益为0，如选R”，两人的收益分别为0和2。

1704418505

1704418506 上面的语言描述可以用如下简明的博弈树表示（这是博弈的扩展式表述，我们将在第2.4节进行更一般的讨论）。博弈树上每一枝的末端都有两个收益值，上面代表参与者1的收益，下面代表参与者2的收益。

1704418507

1704418508

1704418509

1704418510

1704418511 为计算出这一博弈的逆向归纳解，我们从第三阶段（即参与者1的第二次行动）开始。这里参与者1面临的选择是：L”可得收益3，R”可得收益0，于是L”是最优的。那么在第二阶段，参与者2预测到一旦博弈进入到第三阶段，则参与者1会选择，这会使2的收益为0，从而参与者2在第二阶段的选择为：L’可得收益1，R”可得收益0，于是L’是最优的。这样，在第一阶段，参与者1预测到如果博弈进入到第二阶段，2将选择L’，使参与者1的收益为1，从而参与者1在第一阶段的选择是：L收益为2，R收益为1，于是L是最优的。

[ 上一页 ] [ :1.704418462e+09 ] [ 下一页 ]