1704420310
此博弈有一个子博弈:它始于参与者2的单节信息集。这一子博弈(参与者2和3之间的)惟一的纳什均衡为(L,R’),于是整个博弈惟一的子博弈精炼纳什均衡为(D,L,R’)。这一组战略和参与者3的推断p=1满足了要求1到要求3,而且也简单地满足了要求4,因为没有处于这一均衡路径之外的信息集,于是构成了一个精炼贝叶斯均衡。
1704420311
1704420312
1704420313
1704420314
1704420315
图4.1.4
1704420316
1704420317
下面考虑战略(A,L,L’)以及相应的推断p=0。这组战略是一个纳什均衡,没有参与者愿意单独偏离这一结果。这一组战略及推断也满足要求1到3,参与者3有一个推断并根据它选择最优行动。但是,这一纳什均衡却不是子博弈精炼的,因为博弈惟一子博弈的惟一的纳什均衡为(L,R’),这也说明要求1到3并不能保证参与者的战略是子博弈精炼纳什均衡。问题在于参与者3的推断(p=0)与参与者2的战略(L)并不一致,但要求1到3并没有对3的推断进行任何限制,因为如果按给定的战略进行博弈将不会到达3的信息集。不过,要求4强制3的推断决定于参与者2的战略:如果2的战略为L,则3的推断必须为p=1;如果2的战略为R,则3的推断必须为p=0。但是,如果3的推断为p=1,则要求2又强制3的战略为R’,于是战略(A,L,L’)及相应推断p=0不能满足要求1到4。
1704420318
1704420319
为进一步理解要求4,假设图4.1.4稍作改变成为图4.1.5:现在参与者2多出了第三种可能的行动A’,也可以令博弈结束(为使表示简化,这一博弈略去了收益情况)。和前例相同,如果参与者1的均衡战略为A,则参与者3的信息集就处于均衡路径之外,但现在要求4却无法从2的战略中决定3的推断。如果2的战略为A’,则要求4就对3的推断没有任何限制,但如果2的战略为以q1的概率选择L,q2的概率选择R,1-q1-q2的概率选择A’,其中,q1+q2=0,则要求4就限定了3的推断为p=q1/(q1+q2)。
1704420320
1704420321
在本节的最后,我们非正式地讨论精炼贝叶斯均衡和前几章介绍的均衡概念的关系。在纳什均衡中,每一参与者的战略必须是其他参与者战略的一个最优反应,于是没有参与者会选择严格劣战略。在精炼贝叶斯均衡中,要求1和2事实上就是要保证没有参与者的战略是始于任何一个信息集的劣战略。(参见第4.4节给出的始于一个信息集的劣战略的正式定义)纳什均衡及贝叶斯纳什均衡对处于均衡路径之外的信息集则没有这方面的要求,即使是子博弈精炼纳什均衡对某些处于均衡路径之外的信息集也没有这方面的要求,比如对那些不包含在任何子博弈内的信息集。精炼贝叶斯均衡弥补了这一缺陷:参与者不可以威胁使用始于任何信息集的严格劣战略,即使该信息集处于均衡路径之外。
1704420322
1704420323
1704420324
1704420325
1704420326
图4.1.5
1704420327
1704420328
正如前面讲过的,精炼贝叶斯均衡这一概念的优点之一,就是它使得参与者的推断明确化了,从而使我们可以引入要求3和4以及更进一步的要求(对处于均衡路径之外的推断)。由于精炼贝叶斯均衡排除了参与者i选择任何始于处于均衡路径之外信息集的严格劣战略的可能性,要令参与者j相信i会选择这样一个战略当然也是不合情理的。不过,精炼贝叶斯均衡使得参与者的推断明确化了。这种均衡往往不能沿博弈树通过逆向推导而构建出来,像我们构建子博弈精炼纳什均衡时采用的方法一样。要求2决定了参与者在一个给定信息集的行动部分依赖于参与者在该信息集的推断,如果在这一信息集还同时适用于要求3或者要求4,则参与者的推断又由其他参与者在博弈树更上端的行动所决定。但是根据要求2,这些在博弈树更上端的行动又部分依赖于参与者随后的战略,包括在当初信息集的行动。这一循环推论意味着沿博弈树从后向前逆向推导(一般情况下)将不足以计算出精炼贝叶斯均衡。
1704420329
1704420330
1704420331
1704420332
1704420334
博弈论基础 4.2 信号博弈
1704420335
1704420337
4.2.A 信号博弈的精炼贝叶斯均衡
1704420338
1704420339
信号博弈是两个参与者之间的非完全信息动态博弈:信号发送者(Sender,S)和信号接收者(Receiver,R),博弈的时间顺序如下:
1704420340
1704420341
1.自然根据特定的概率分布p(ti),从可行的类型集T={t1,…,tn}中赋予发送者某种类型ti,这里对所有的i,p(ti)>0并且p(t1)+…+p(t1)=1;
1704420342
1704420343
2.发送者观测到ti,然后从可行的信号集M={m1,…,mj}中选择一个发送信号mj;
1704420344
1704420345
3.接收者观测到mj(但不能观测到ti),然后从可行的行动集A{a1,…,ak}中选择一个行动ak;
1704420346
1704420347
4.双方收益分别由us(ti,mj,ak)和ur(ti,mj,ak)给出。
1704420348
1704420349
在许多应用中,可行集合T、M及A为实数轴上的区间,而不是上面考虑的有限集。而允许可行的信号集依赖于自然赋予的类型,可行的行动集又依赖于发送者选择的信号的情况也十分容易理解。
1704420350
1704420351
信号模型已被十分广泛地应用于经济学领域。为说明其潜在应用的广泛性,我们把将在第4.2.B和第4.2.C节分析的三个应用套用1—4式的规范结构简述如下:
1704420352
1704420353
在斯彭斯(1973)的劳动力市场模型中,发送者是一个求职的工人,接收者是潜在的雇主市场,类型为工人的生产能力,信号是工人对教育的选择,行动是市场支付的工资。
1704420354
1704420355
在迈尔斯和迈卢夫(1984)的公司投资和资本结构模型中,发送者为要为一个新项目融资的企业,接收者为潜在的投资者,类型为现存资产的盈利能力,信号为企业为所融资金承诺的权益份额,行动则是投资者就是否投资作出的决定。
1704420356
1704420357
在一些应用中,信号博弈被融于内容更为丰富的博弈之中。例如,在第二步发送者选择信号之前,接收者可能会有一个行动,或是在第四步接收者选择行动之后(或当时)发送者会有一定的行动。
1704420358
1704420359
在维克斯(1986)的货币政策模型中,联邦储备局享有的私人信息是其为促进就业而愿意接受的通货膨胀水平,其他的条件与第2.3.E节分析的完全信息重复博弈完全相同,不过只包含两个阶段。这样,发送者为联储当局,接收者为就业市场,类型为联储为促进就业而愿意接受的通胀水平,信号为联储对第一期通胀的选择,行动为雇主们对第二期通胀的预期。雇主们对第一期通胀的预期发生在信号博弈之前,联储对第二期通胀水平的选择则在其后。
[
上一页 ]
[ :1.70442031e+09 ]
[
下一页 ]