打字猴:1.704419393e+09
1704419393 2.参与者2观测到a1,然后从可行集A2={L’,R’}中选择行动a2;
1704419394
1704419395 3.参与者3观测是否(a1,a2)=(R,R’),然后从可行集A3={L”,R”}中选择行动a3。
1704419396
1704419397
1704419398
1704419399
1704419400 图2.4.4
1704419401
1704419402 这一博弈的扩展式表述(为简化起见,略去每个参与者的相应收益)如图2.4.4所给出。在扩展式中,参与者3有两个信息集:如果1选择R,2选择R’,参与者3进入只有一个决策节的信息集,此种情况之外轮到3行动时,则他进入包含其余所有决策节的信息集。从而,参与者3所能够观测到的只是(a1,a2)是否等于(R,R’)。
1704419403
1704419404 在引入了信息集的概念之后,我们可以给出区分完美信息和非完美信息的另外一种定义。前面我们曾将完美信息定义为在博弈的每一步行动中,轮到行动的参与者了解前面博弈进行的全部过程。对完美信息的一个等价的定义是每一个信息集都是单节的;相反,非完美信息则意味着至少存在一个非单节的信息集[19]。那么,一个同时行动博弈(如囚徒困境)的扩展式表述就是一个非完美信息博弈。同理,第2.2.A节讨论的两阶段博弈也是非完美信息的,因为参与者1和2的行动是同时的,参与者3和4的行动也是同时的。更为一般地,一个完全但非完美信息动态博弈可用含有非单节信息集的扩展式表示,从而可以看出每一参与者在轮到他行动时,知道(以及不知道)什么,这一点,图2.4.4已给出一个例子。
1704419405
1704419406 博弈论基础 [:1704417413]
1704419407 2.4.B 子博弈精炼纳什均衡
1704419408
1704419409 第2.3.B节给出了子博弈精炼纳什均衡的一般性定义。但当时我们只把这一定义用于重复博弈,因为我们只针对重复博弈定义了战略和子博弈的概念。在第2.4.A节我们给出了战略这一概念的一般性定义,现在再给出子博弈的一般性定义,其后就可以把子博弈精炼纳什均衡的概念应用于一般的完全信息动态博弈了。
1704419410
1704419411 回顾第2.3.B节我们曾给出的子博弈的非正式定义,即从博弈进行到的某一点开始,前面整个博弈的进行过程在所有参与者中都是共同知识,始于该点的其余部分的博弈就是原博弈的一个子博弈,并针对重复博弈给出了子博弈的正式定义。下面我们对用扩展式表述的一般完全信息动态博弈给出子博弈的正式定义。
1704419412
1704419413 定义 扩展式博弈中的子博弈
1704419414
1704419415 (a)始于单节信息集的决策节n(但不包括博弈的第一个决策节);
1704419416
1704419417 (b)包含博弈树中n之下所有的决策节和终点节(但不在n下面的除外);
1704419418
1704419419 (c)没有对任何信息集形成分割。(即如果博弈树中n之下有一个决策节n’,则和n’处于同一信息集的其他决策节也必须在n之下,从而也必须包含于子博弈中。)
1704419420
1704419421 定义中,(a)的附注说明了我们不把整个博弈看成一个子博弈,但这只是一个习惯问题:把定义中的括号除去对我们以后的分析不会产生任何影响。
1704419422
1704419423 我们可以利用图2.4.1和图2.4.3的囚徒困境说明定义中的前两部分(a)和(b)。图2.4.1中,存在两个子博弈,分别始于参与者2的两个决策节。在囚徒困境(或其他任何同时行动博弈)中不存在子博弈。为说明定义的最后部分(c),考虑图2.4.4给出的博弈,该博弈只有一个子博弈,它始于参与者1选择R,参与者2选择R’之后参与者3的决策节。由于(c)的限制,参与者2的两个决策节之下都不能构成一个子博弈,即使这两个决策节都处于单节的信息集。
1704419424
1704419425 之所以在定义中要加上(c)的限制,是因为我们希望能够把子博弈当成一个独立的博弈进行分析,并且分析的结果能用于原博弈。在图2.4.4中,如果我们试着把参与者1选择L之后参与者2的决策节看成一个子博弈的起点,事实上我们是制造了一个子博弈,其中参与者3不知道参与者2的行动,但却知道参与者1的行动。对这样一个子博弈的分析与原博弈就不存在相关性,因为在原博弈中参与者3并不知道1的行动,而只能观测到(a1,a2)是否等于(R,R’)。请回顾在讨论重复博弈时相似的论证,即第t阶段的阶段博弈(有限重复时t<T)本身并不是重复博弈的一个子博弈。
1704419426
1704419427 对(c)必要性的另一种理解,是(a)只保证了在决策节n应该行动的参与者知道博弈到此为止的整个进行过程,而不能保证其他参与者也知道这一过程,(c)则保证了博弈到该点为止的整个过程在所有参与者中是共同知识,原因如下:在n之后的任何节,比如n’,在n’应该行动的参与者知道博弈到达了决策节n,从而即使n’处于非单节的信息集,由于在该信息集中的所有节都在n之下,在该信息集行动的参与者就知道博弈已经到达了n下面的某个决策节。(如果认为后面的叙述有些拗口,部分因为博弈的标准式表述只明确了在参与者i的每一个决策节i知道的信息,而并没有明确指出在j的决策节i知道的信息。)前面已讲过,图2.4.4就提供了不符合(c)的一个例子。现在,我们可以重新解释这个例子,如果我们(非正式地)分析一下在参与者1选择L之后参与者2的决策节上参与者3知道的信息,就会发现3并不知道博弈到该点为止的全部进行过程,因为在其后3的决策节中,他并不知道1是选择了L还是选择了R。
1704419428
1704419429 在给出子博弈的一般定义之后,我们就可以使用第2.3.B节给出的子博弈精炼纳什均衡的定义了:
1704419430
1704419431 定义(塞尔滕,1965)如果参与者的战略在每一个子博弈中都构成了纳什均衡,则称纳什均衡是      子博弈精炼      的。
1704419432
1704419433 任何有限的完全信息动态博弈(即任何参与者有限、每一参与者的可行战略集有限的博弈)都存在子博弈精炼纳什均衡,也许包含混合战略。这一结论的证明思路非常简单,即根据逆向归纳的原理,构建出子博弈精炼纳什均衡,并基于下面两个观察结论。第一,尽管纳什定理是在完全信息静态博弈的条件下给出的,它适用于任何有限的完全信息的标准式博弈,并且我们已经证明此类博弈既可以是静态的,又可以是动态的。第二,一个有限的完全信息动态博弈的子博弈数也是有限的,而每个子博弈都满足纳什定理的假定。[20]
1704419434
1704419435 我们已介绍过与子博弈精炼纳什均衡密切相关的两个概念:第2.1.A节定义的逆向归纳解和第2.2.A节定义的子博弈精炼解。不太正式地讲,其区别在于一个均衡是战略的集合(战略又是关于行动的完全的计划),而一个解则只对期望将要发生的情况给出相应的行动及结果,而不是针对所有可能发生的情况。要进一步精确界定“均衡”和“解”的区别,并更好地说明子博弈精炼纳什均衡的概念,现在我们重新考虑第2.1.A节和第2.2.A节定义的博弈。
1704419436
1704419437
1704419438
1704419439 定义 在第2.1.A节定义的完全且完美信息两阶段博弈中,逆向归纳解为,但子博弈精炼纳什均衡为
1704419440
1704419441
1704419442
[ 上一页 ]  [ :1.704419393e+09 ]  [ 下一页 ]