打字猴:1.704419408e+09
1704419408
1704419409 第2.3.B节给出了子博弈精炼纳什均衡的一般性定义。但当时我们只把这一定义用于重复博弈,因为我们只针对重复博弈定义了战略和子博弈的概念。在第2.4.A节我们给出了战略这一概念的一般性定义,现在再给出子博弈的一般性定义,其后就可以把子博弈精炼纳什均衡的概念应用于一般的完全信息动态博弈了。
1704419410
1704419411 回顾第2.3.B节我们曾给出的子博弈的非正式定义,即从博弈进行到的某一点开始,前面整个博弈的进行过程在所有参与者中都是共同知识,始于该点的其余部分的博弈就是原博弈的一个子博弈,并针对重复博弈给出了子博弈的正式定义。下面我们对用扩展式表述的一般完全信息动态博弈给出子博弈的正式定义。
1704419412
1704419413 定义 扩展式博弈中的子博弈
1704419414
1704419415 (a)始于单节信息集的决策节n(但不包括博弈的第一个决策节);
1704419416
1704419417 (b)包含博弈树中n之下所有的决策节和终点节(但不在n下面的除外);
1704419418
1704419419 (c)没有对任何信息集形成分割。(即如果博弈树中n之下有一个决策节n’,则和n’处于同一信息集的其他决策节也必须在n之下,从而也必须包含于子博弈中。)
1704419420
1704419421 定义中,(a)的附注说明了我们不把整个博弈看成一个子博弈,但这只是一个习惯问题:把定义中的括号除去对我们以后的分析不会产生任何影响。
1704419422
1704419423 我们可以利用图2.4.1和图2.4.3的囚徒困境说明定义中的前两部分(a)和(b)。图2.4.1中,存在两个子博弈,分别始于参与者2的两个决策节。在囚徒困境(或其他任何同时行动博弈)中不存在子博弈。为说明定义的最后部分(c),考虑图2.4.4给出的博弈,该博弈只有一个子博弈,它始于参与者1选择R,参与者2选择R’之后参与者3的决策节。由于(c)的限制,参与者2的两个决策节之下都不能构成一个子博弈,即使这两个决策节都处于单节的信息集。
1704419424
1704419425 之所以在定义中要加上(c)的限制,是因为我们希望能够把子博弈当成一个独立的博弈进行分析,并且分析的结果能用于原博弈。在图2.4.4中,如果我们试着把参与者1选择L之后参与者2的决策节看成一个子博弈的起点,事实上我们是制造了一个子博弈,其中参与者3不知道参与者2的行动,但却知道参与者1的行动。对这样一个子博弈的分析与原博弈就不存在相关性,因为在原博弈中参与者3并不知道1的行动,而只能观测到(a1,a2)是否等于(R,R’)。请回顾在讨论重复博弈时相似的论证,即第t阶段的阶段博弈(有限重复时t<T)本身并不是重复博弈的一个子博弈。
1704419426
1704419427 对(c)必要性的另一种理解,是(a)只保证了在决策节n应该行动的参与者知道博弈到此为止的整个进行过程,而不能保证其他参与者也知道这一过程,(c)则保证了博弈到该点为止的整个过程在所有参与者中是共同知识,原因如下:在n之后的任何节,比如n’,在n’应该行动的参与者知道博弈到达了决策节n,从而即使n’处于非单节的信息集,由于在该信息集中的所有节都在n之下,在该信息集行动的参与者就知道博弈已经到达了n下面的某个决策节。(如果认为后面的叙述有些拗口,部分因为博弈的标准式表述只明确了在参与者i的每一个决策节i知道的信息,而并没有明确指出在j的决策节i知道的信息。)前面已讲过,图2.4.4就提供了不符合(c)的一个例子。现在,我们可以重新解释这个例子,如果我们(非正式地)分析一下在参与者1选择L之后参与者2的决策节上参与者3知道的信息,就会发现3并不知道博弈到该点为止的全部进行过程,因为在其后3的决策节中,他并不知道1是选择了L还是选择了R。
1704419428
1704419429 在给出子博弈的一般定义之后,我们就可以使用第2.3.B节给出的子博弈精炼纳什均衡的定义了:
1704419430
1704419431 定义(塞尔滕,1965)如果参与者的战略在每一个子博弈中都构成了纳什均衡,则称纳什均衡是      子博弈精炼      的。
1704419432
1704419433 任何有限的完全信息动态博弈(即任何参与者有限、每一参与者的可行战略集有限的博弈)都存在子博弈精炼纳什均衡,也许包含混合战略。这一结论的证明思路非常简单,即根据逆向归纳的原理,构建出子博弈精炼纳什均衡,并基于下面两个观察结论。第一,尽管纳什定理是在完全信息静态博弈的条件下给出的,它适用于任何有限的完全信息的标准式博弈,并且我们已经证明此类博弈既可以是静态的,又可以是动态的。第二,一个有限的完全信息动态博弈的子博弈数也是有限的,而每个子博弈都满足纳什定理的假定。[20]
1704419434
1704419435 我们已介绍过与子博弈精炼纳什均衡密切相关的两个概念:第2.1.A节定义的逆向归纳解和第2.2.A节定义的子博弈精炼解。不太正式地讲,其区别在于一个均衡是战略的集合(战略又是关于行动的完全的计划),而一个解则只对期望将要发生的情况给出相应的行动及结果,而不是针对所有可能发生的情况。要进一步精确界定“均衡”和“解”的区别,并更好地说明子博弈精炼纳什均衡的概念,现在我们重新考虑第2.1.A节和第2.2.A节定义的博弈。
1704419436
1704419437
1704419438
1704419439 定义 在第2.1.A节定义的完全且完美信息两阶段博弈中,逆向归纳解为,但子博弈精炼纳什均衡为
1704419440
1704419441
1704419442
1704419443
1704419444
1704419445
1704419446
1704419447
1704419448
1704419449
1704419450 在这样的博弈中,行动即为参与者1的一个战略,因为参与者1只可能在一种情况下选择行动——即在博弈刚开始,不过对参与者2,却只是一个行动(具体地说,是对的最优反应),而并非一个战略,因为参与者2的一个战略必须包含针对1在第一阶段每个可能的行动,参与者2将采取的行动。从而,参与者2的最优反应函数R2(a1)是其一个战略。在此类博弈中,子博弈始于(并只包含)参与者2在第二阶段的行动。对参与者1的每一个可能行动a1属于A1都存在一个子博弈,从而为证明是一个子博弈精炼纳什均衡,我们必须证明是一个纳什均衡,并且参与者的战略在每一个子博弈中都构成一个纳什均衡。由于子博弈都只是单人决策问题,后一问题就可简单化为要求参与者2的行动在每一子博弈中都是最优的,它又正是参与者2的最优反应函数R2(a1)所解决的问题。最后,是一个纳什均衡,因为参与者的战略互为最优反应:a*是R2(a1)的最优反应,即令u1(a1R2(a1))最大化,并且R2(a1)为a*的最优反应,即令最大化。
1704419451
1704419452 对第2.2.A节分析的博弈,其论证过程是相似的,所以我们只进行简要的讨论。
1704419453
1704419454
1704419455
1704419456 定义 在第2.2.A节定义的完全非完美信息两阶段博弈中,子博弈精炼解为,但子博弈精炼纳什均衡为。
1704419457
[ 上一页 ]  [ :1.704419408e+09 ]  [ 下一页 ]