打字猴:1.704419382e+09

1704419382

1704419383

1704419384

1704419385 图2.4.3

1704419386

1704419387 在一个扩展式博弈中，为表示某些决策节处于同一信息集中，我们用虚线把这些决策节连起来，如图2.4.3给出的囚徒困境的扩展式表述。有时我们在同一信息集中每个决策节旁边注明轮到哪一个参与者行动，如图2.4.3所示；有时我们只是在连接这些节的虚线上注明轮到哪一参与者行动，如图2.4.4所示。图2.4.3中，囚徒2的信息集表示在轮到囚徒2行动时，他只知道到达了这一信息集（即囚徒1已经行动过了），但是并不清楚到达了哪一个节（即囚徒1是如何行动的）。在第4章中我们将讲到囚徒2会对囚徒1的行动持有一个猜测或推断，即使他并不能观察到前者的行动，但目前我们暂时不考虑这一因素。

1704419388

1704419389 作为运用信息集表示不了解前面行动的第二个例子，考虑下面的完全非完美信息动态博弈：

1704419390

1704419391 1.参与者1从可行集A1={L，R}中选择行动a1；

1704419392

1704419393 2.参与者2观测到a1，然后从可行集A2={L’，R’}中选择行动a2；

1704419394

1704419395 3.参与者3观测是否（a1，a2）=（R，R’），然后从可行集A3={L”，R”}中选择行动a3。

1704419396

1704419397

1704419398

1704419399

1704419400 图2.4.4

1704419401

1704419402 这一博弈的扩展式表述（为简化起见，略去每个参与者的相应收益）如图2.4.4所给出。在扩展式中，参与者3有两个信息集：如果1选择R，2选择R’，参与者3进入只有一个决策节的信息集，此种情况之外轮到3行动时，则他进入包含其余所有决策节的信息集。从而，参与者3所能够观测到的只是（a1，a2）是否等于（R，R’）。

1704419403

1704419404 在引入了信息集的概念之后，我们可以给出区分完美信息和非完美信息的另外一种定义。前面我们曾将完美信息定义为在博弈的每一步行动中，轮到行动的参与者了解前面博弈进行的全部过程。对完美信息的一个等价的定义是每一个信息集都是单节的；相反，非完美信息则意味着至少存在一个非单节的信息集[19]。那么，一个同时行动博弈（如囚徒困境）的扩展式表述就是一个非完美信息博弈。同理，第2.2.A节讨论的两阶段博弈也是非完美信息的，因为参与者1和2的行动是同时的，参与者3和4的行动也是同时的。更为一般地，一个完全但非完美信息动态博弈可用含有非单节信息集的扩展式表示，从而可以看出每一参与者在轮到他行动时，知道（以及不知道）什么，这一点，图2.4.4已给出一个例子。

1704419405

1704419406 博弈论基础 [:1704417413]

1704419407 2.4.B 子博弈精炼纳什均衡

1704419408

1704419409 第2.3.B节给出了子博弈精炼纳什均衡的一般性定义。但当时我们只把这一定义用于重复博弈，因为我们只针对重复博弈定义了战略和子博弈的概念。在第2.4.A节我们给出了战略这一概念的一般性定义，现在再给出子博弈的一般性定义，其后就可以把子博弈精炼纳什均衡的概念应用于一般的完全信息动态博弈了。

1704419410

1704419411 回顾第2.3.B节我们曾给出的子博弈的非正式定义，即从博弈进行到的某一点开始，前面整个博弈的进行过程在所有参与者中都是共同知识，始于该点的其余部分的博弈就是原博弈的一个子博弈，并针对重复博弈给出了子博弈的正式定义。下面我们对用扩展式表述的一般完全信息动态博弈给出子博弈的正式定义。

1704419412

1704419413 定义扩展式博弈中的子博弈

1704419414

1704419415 （a）始于单节信息集的决策节n（但不包括博弈的第一个决策节）；

1704419416

1704419417 （b）包含博弈树中n之下所有的决策节和终点节（但不在n下面的除外）；

1704419418

1704419419 （c）没有对任何信息集形成分割。（即如果博弈树中n之下有一个决策节n’，则和n’处于同一信息集的其他决策节也必须在n之下，从而也必须包含于子博弈中。）

1704419420

1704419421 定义中，（a）的附注说明了我们不把整个博弈看成一个子博弈，但这只是一个习惯问题：把定义中的括号除去对我们以后的分析不会产生任何影响。

1704419422

1704419423 我们可以利用图2.4.1和图2.4.3的囚徒困境说明定义中的前两部分（a）和（b）。图2.4.1中，存在两个子博弈，分别始于参与者2的两个决策节。在囚徒困境（或其他任何同时行动博弈）中不存在子博弈。为说明定义的最后部分（c），考虑图2.4.4给出的博弈，该博弈只有一个子博弈，它始于参与者1选择R，参与者2选择R’之后参与者3的决策节。由于（c）的限制，参与者2的两个决策节之下都不能构成一个子博弈，即使这两个决策节都处于单节的信息集。

1704419424

1704419425 之所以在定义中要加上（c）的限制，是因为我们希望能够把子博弈当成一个独立的博弈进行分析，并且分析的结果能用于原博弈。在图2.4.4中，如果我们试着把参与者1选择L之后参与者2的决策节看成一个子博弈的起点，事实上我们是制造了一个子博弈，其中参与者3不知道参与者2的行动，但却知道参与者1的行动。对这样一个子博弈的分析与原博弈就不存在相关性，因为在原博弈中参与者3并不知道1的行动，而只能观测到（a1，a2）是否等于（R，R’）。请回顾在讨论重复博弈时相似的论证，即第t阶段的阶段博弈（有限重复时t＜T）本身并不是重复博弈的一个子博弈。

1704419426

1704419427 对（c）必要性的另一种理解，是（a）只保证了在决策节n应该行动的参与者知道博弈到此为止的整个进行过程，而不能保证其他参与者也知道这一过程，（c）则保证了博弈到该点为止的整个过程在所有参与者中是共同知识，原因如下：在n之后的任何节，比如n’，在n’应该行动的参与者知道博弈到达了决策节n，从而即使n’处于非单节的信息集，由于在该信息集中的所有节都在n之下，在该信息集行动的参与者就知道博弈已经到达了n下面的某个决策节。（如果认为后面的叙述有些拗口，部分因为博弈的标准式表述只明确了在参与者i的每一个决策节i知道的信息，而并没有明确指出在j的决策节i知道的信息。）前面已讲过，图2.4.4就提供了不符合（c）的一个例子。现在，我们可以重新解释这个例子，如果我们（非正式地）分析一下在参与者1选择L之后参与者2的决策节上参与者3知道的信息，就会发现3并不知道博弈到该点为止的全部进行过程，因为在其后3的决策节中，他并不知道1是选择了L还是选择了R。

1704419428

1704419429 在给出子博弈的一般定义之后，我们就可以使用第2.3.B节给出的子博弈精炼纳什均衡的定义了：

1704419430

1704419431 定义（塞尔滕，1965）如果参与者的战略在每一个子博弈中都构成了纳什均衡，则称纳什均衡是子博弈精炼的。

[ 上一页 ] [ :1.704419382e+09 ] [ 下一页 ]