打字猴:1.704419311e+09

1704419311 博弈论基础 [:1704417412]

1704419312 2.4.A 博弈的扩展式表述

1704419313

1704419314 在第1章我们运用博弈的标准式表述分析了静态博弈，这里我们引入博弈的扩展式表述并用它分析动态博弈。[18]这一解释方法可能会给人一个印象，那就是静态博弈一定要用标准式表述，动态博弈一定要用扩展式表述。但这是一种误解，任何博弈都既可以用标准式表述，又可以用扩展式表述，尽管对某些博弈来讲，用其中一种表述形式分析起来较另外一种要方便一些。我们将讨论如何利用扩展形式表述一个静态博弈，以及如何利用标准式来表述一个动态博弈。

1704419315

1704419316 在第1.1.A节曾经讲过，一个博弈的标准式表述包含的要素有：（1）博弈的参与人；（2）每一参与人可供选择的战略，及（3）与参与者可能选择的每一战略组合相对应的各个参与者的收益。

1704419317

1704419318 定义一个博弈的扩展式表述包括：（1）博弈中的参与人；（2a）每一参与者在何时行动；（2b）每次轮到某一参与者行动时，可供他选择的行动；（2c）每次轮到某一参与者行动时，他所了解的信息；及（3）与参与者可能选择的每一行动组合相对应的各个参与者的收益。

1704419319

1704419320 事实上，在第2.1到2.3节我们已经分析过几个用扩展式表述的博弈，尽管当时没有明确这一概念。本节的主要内容是引入博弈树描述博弈的扩展式，而不是文字描述，因为前者在通常情况下更便于表示和分析。

1704419321

1704419322

1704419323

1704419324

1704419325 图2.4.1

1704419326

1704419327 作为博弈扩展式表述的一个例子，考虑属于第2.1.A节介绍过的完全且完美信息两阶段博弈的一个具体例子：

1704419328

1704419329 1.参与者1从可行集A1={L，R}中选择行动a1；

1704419330

1704419331 2.参与者2观测到a1，然后从可行集A2={L’，R’}中选择行动a2；

1704419332

1704419333 3.两参与者的收益分别为u1（a1，a2）和u2（a1，a2），如图2.4.1的博弈树所示。

1704419334

1704419335 这一博弈树始于参与者1的一个决策节（decision node），这时1要从L和R中作出选择，如果参与者1选择L，其后就到达参与者2的一个决策节，这时2要从L’和R’中选择行动。类似地，如果参与者1选择R，则将到达参与者2的另一个决策节，这时2从L’和R’中选择行动。无论2选择了哪一个，都将到达终点节（terminal node）（即博弈结束）且两参与者分别得到相应终点节下面的收益。

1704419336

1704419337 用类似的方法可将图2.4.1的博弈树进行扩展，用来表示所有完全且完美信息动态博弈——即任何参与者顺序行动、对下一行动作出选择之前其前面所有行动都是共同知识，并且每一可能的行动组合下各参与者的收益也是共同知识的博弈。（如斯塔克尔贝里模型中行动空间连续的情况，或鲁宾斯坦模型中行动空间无限的情况，只是给图形表示带来了困难，但从概念上讲却没有任何障碍。）此后我们将导出图2.4.1所示动态博弈的标准式表述，并在本节的最后证明静态博弈也可以给出扩展式表述，并介绍如何构建完全非完美信息动态博弈的扩展式表述。

1704419338

1704419339 正如在对标准式和扩展式定义中的序号所代表的，标准式定义中“一个参与者可行的战略”（第二条）与扩展式定义中“一个参与者何时行动、他可以如何行动及他了解什么信息”（第2a、2b和2c条），有着非常密切的关系。为把一个动态博弈表示为标准式，我们需把扩展式中的信息转换为对标准式中每一参与者战略空间的描述。为做到这一点，回顾第2.3.B节给出的“战略”的（非正式）定义：

1704419340

1704419341 定义参与者的一个战略是关于行动的一个完整计划——它明确了在参与者可能会遇到的每一种情况下对可行行动的选择。

1704419342

1704419343 要求参与者的一个战略明确该参与者可能会遇到的每一种情况下的行动选择，看起来似乎是不必要的。不过，很快我们将会看到，如果允许参与者的一个战略中没有明确某些情况下该参与者的行动，我们将无法在完全信息动态博弈中使用纳什均衡概念。在参与者j计算针对参与者i的战略的最优反应时，j需要考虑在每一种情况下i将如何行动，而并非仅考虑在i或j认为最有可能发生的情况下对方的行动。

1704419344

1704419345 在图2.4.1的博弈中，参与者2有两个行动，却有4个战略，因为还存在着两种不同的情况（具体地说，分别是观测到参与者1选择L和观测到参与者1选择R后的情况），参与者2将可能在这两种情况下进行选择：

1704419346

1704419347 战略1：如果参与者1选择L，则选择L’，如果参与者1选择R，则选择L’，表示为（L’，L’）；

1704419348

1704419349 战略2：如果参与者1选择L，则选择L’，如果参与者1选择R，则选择R’，表示为（L’，R’）；

1704419350

1704419351 战略3：如果参与者1选择L，则选择R’，如果参与者1选择R，则选择L’，表示为（R’，R’）；

1704419352

1704419353 战略4：如果参与者1选择L，则选择R’，如果参与者1选择R，则选择R’，表示为（R’，R’）。

1704419354

1704419355 不过对参与者1来讲，有两个行动但同时也只有两个战略：选择L和选择R。参与者1之所以只有两个战略，是因为参与者1行动时只有可能面临一种情况（具体地说，就是在博弈的一开始，这时自然由参与者1行动），于是参与者1的战略空间与其行动空间是相同的，即A1={L，R}。

1704419356

1704419357 给出两参与者的战略空间后，从博弈的扩展式表述导出其标准式表述就十分简单了。用标准式表述中的行表示参与者1的可行战略，列表示参与者2的可行战略，并计算参与者每一可能的战略组合下每人的收益，如图2.4.2所示。

1704419358

1704419359

1704419360

[ 上一页 ] [ :1.704419311e+09 ] [ 下一页 ]