1704419363
1704419364
现在我们已证明一个动态博弈可以表示为标准式,下面我们反过来说明一个静态(即同时行动)博弈如何用扩展式表述。要做到这一点,我们要运用第1.1.A节与囚徒困境相关的一个观察结果,静态博弈中参与者不一定要同时行动:每个参与者在选择战略时不知道其他参与者的选择就足够了。正如囚徒困境中分开关押的囚犯可以在任何时间作出他们的决策。从而我们可以把(所谓的)参与者1和2之间的同时行动博弈表示如下:
1704419365
1704419366
1.参与者1从可行集中选择行动a1;
1704419367
1704419368
2.参与者2没有观测到参与者1的行动,并从可行集中选择行动a2;
1704419369
1704419370
3.两参与者的收益分别为u1(a1,a2)和u2(a1,a2)。
1704419371
1704419372
或换一种顺序,参与者2可以首先行动,接着参与者1在没有观测到参与者2行动的情况下行动。回顾我们在第2.1.B节介绍的斯塔克尔贝里博弈,企业2在行动之前观测到企业1的产量,当时还提到一个与之时序完全相同,但信息结构却不同的情况,那里我们证明,在这一序贯行动,并不能观测到其他参与者行动的博弈中,有着和同时行动的古诺博弈相同的纳什均衡。
1704419373
1704419374
为在博弈的扩展式中表示此类不知道以前行动的情况,我们引入一个新的概念——参与者的 信息集 (information set):
1704419375
1704419376
定义 参与者的一个 信息集 指满足以下条件的决策节的集合:
1704419377
1704419378
(i)在此信息集中的每一个节都轮到该参与者行动,且(ii)当博弈的进行达到信息集中的一个结,应该行动的参与者并不知道达到了(或没有达到)信息集中的哪一个节。
1704419379
1704419380
这一定义的第(ii)部分意味着参与者在一个信息集中的每一个决策节都有着相同的可行行动集合,否则该参与者就可通过他面临的不同的可行行动集来推断到达了(或没有到达)某些节。
1704419381
1704419382
1704419383
1704419384
1704419385
图2.4.3
1704419386
1704419387
在一个扩展式博弈中,为表示某些决策节处于同一信息集中,我们用虚线把这些决策节连起来,如图2.4.3给出的囚徒困境的扩展式表述。有时我们在同一信息集中每个决策节旁边注明轮到哪一个参与者行动,如图2.4.3所示;有时我们只是在连接这些节的虚线上注明轮到哪一参与者行动,如图2.4.4所示。图2.4.3中,囚徒2的信息集表示在轮到囚徒2行动时,他只知道到达了这一信息集(即囚徒1已经行动过了),但是并不清楚到达了哪一个节(即囚徒1是如何行动的)。在第4章中我们将讲到囚徒2会对囚徒1的行动持有一个猜测或推断,即使他并不能观察到前者的行动,但目前我们暂时不考虑这一因素。
1704419388
1704419389
作为运用信息集表示不了解前面行动的第二个例子,考虑下面的完全非完美信息动态博弈:
1704419390
1704419391
1.参与者1从可行集A1={L,R}中选择行动a1;
1704419392
1704419393
2.参与者2观测到a1,然后从可行集A2={L’,R’}中选择行动a2;
1704419394
1704419395
3.参与者3观测是否(a1,a2)=(R,R’),然后从可行集A3={L”,R”}中选择行动a3。
1704419396
1704419397
1704419398
1704419399
1704419400
图2.4.4
1704419401
1704419402
这一博弈的扩展式表述(为简化起见,略去每个参与者的相应收益)如图2.4.4所给出。在扩展式中,参与者3有两个信息集:如果1选择R,2选择R’,参与者3进入只有一个决策节的信息集,此种情况之外轮到3行动时,则他进入包含其余所有决策节的信息集。从而,参与者3所能够观测到的只是(a1,a2)是否等于(R,R’)。
1704419403
1704419404
在引入了信息集的概念之后,我们可以给出区分完美信息和非完美信息的另外一种定义。前面我们曾将完美信息定义为在博弈的每一步行动中,轮到行动的参与者了解前面博弈进行的全部过程。对完美信息的一个等价的定义是每一个信息集都是单节的;相反,非完美信息则意味着至少存在一个非单节的信息集[19]。那么,一个同时行动博弈(如囚徒困境)的扩展式表述就是一个非完美信息博弈。同理,第2.2.A节讨论的两阶段博弈也是非完美信息的,因为参与者1和2的行动是同时的,参与者3和4的行动也是同时的。更为一般地,一个完全但非完美信息动态博弈可用含有非单节信息集的扩展式表示,从而可以看出每一参与者在轮到他行动时,知道(以及不知道)什么,这一点,图2.4.4已给出一个例子。
1704419405
1704419407
2.4.B 子博弈精炼纳什均衡
1704419408
1704419409
第2.3.B节给出了子博弈精炼纳什均衡的一般性定义。但当时我们只把这一定义用于重复博弈,因为我们只针对重复博弈定义了战略和子博弈的概念。在第2.4.A节我们给出了战略这一概念的一般性定义,现在再给出子博弈的一般性定义,其后就可以把子博弈精炼纳什均衡的概念应用于一般的完全信息动态博弈了。
1704419410
1704419411
回顾第2.3.B节我们曾给出的子博弈的非正式定义,即从博弈进行到的某一点开始,前面整个博弈的进行过程在所有参与者中都是共同知识,始于该点的其余部分的博弈就是原博弈的一个子博弈,并针对重复博弈给出了子博弈的正式定义。下面我们对用扩展式表述的一般完全信息动态博弈给出子博弈的正式定义。
1704419412
[
上一页 ]
[ :1.704419363e+09 ]
[
下一页 ]