1704419677
1704419678
[2] 参与者2的可选择行动空间A2,可以允许依赖于参与者1的行动a1。这种依赖性可以表示为A2(a1),或者可以合并到参与者2的收益函数中,对那些给定a1时不可行的a2,令u1(a1,a2)=-∞。有时参与者1的某些行动甚至可以结束整个博弈,不给参与者2行动的机会,对这样的a1值,可行的行动空间A2(a1)中只有一个元素,令参与者2别无选择。
1704419679
1704419680
[3] 回想我们在重复剔除严格劣战略的讨论时(在第1.1.B节),参与者是理性的是共同知识,如果所有参与者都是理性的,并且所有参与者都知道所有参与者都是理性的,并且所有参与者都知道所有参与者都知道所有参与者都是理性的,如此等等,以至无穷。
1704419681
1704419682
[4] 正如“古诺均衡”和“贝特兰德均衡”一般是指古诺和贝特兰德博弈中的纳什均衡,提及“斯塔克尔贝里均衡”一般表示序贯行动博弈,用以和同时行动相区别。但如前一节提到过的,序贯行动博弈有时会有多个纳什均衡,只有一个是和博弈的逆向归纳解相关的,这样“斯塔克尔贝里均衡”就有了双重含义,既表示博弈的序贯行动特点,又用来表示比简单纳什均衡条件更强的解的概念。
1704419683
1704419684
[5] 此例也说明了,我们在第l.1.A节中作出的一个结论:在标准式博弈中,参与者同时选择各自的战略,但这并不要求各方必须同时行动;只要每个人在选择自己的行动时不知道其他人的选择就足够了。关于这一点的进一步讨论参见第2.4.A节。
1704419685
1704419686
[6] 后面一点只不过是L*(w)定义的另一种表述,即对给定的w,L*(w)使π(w,L)最大化。比如工会开价w’,则企业沿w=w’的水平线选择L,而企业选择的就业L能使可能的利润达到最高,从而使通过(L,w’)的等利润曲线与约束w=w’相切。
1704419687
1704419688
[7] 贴现因子δ反映了货币的时间价值。在一个阶段开始时取得的一美元可以存入银行,赚取利息,比如说每期利息为r,则在下一阶段开始时的价值就成为1+r美元。同样,下一阶段开始时要得到的一美元,现在的价值只有1/(1+r)美元。令δ=1/(1+r),则下一阶段可得到的收益π现值只有δπ,距现在两个阶段之后得到的收益π现值只有δ2π,如此等等。未来收益今天的价值称为这一收益的现值。
1704419689
1704419690
[8] 和前一节中相同,参与者3和4在第二阶段的可行集A3和A4,可以依赖于第一阶段的结果(a1,a2),在特定条件下,可以存在(a1,a2)使博弈结束。
1704419691
1704419692
1704419693
[9] 如果消费者用p的价格购买一件他愿意出价钱υ的商品,则他享受到υ-p的剩余。给定反需求函数Pi(Qi)=a-Q,如果市场i销售的总产量为Qi,则总的消费者剩余可表示为(1/2)。
1704419694
1704419695
[10] 为使对这一应用的分析保持简洁,我们略去了几个技术细节,比如保证工人的一阶条件充分性的条件。不过,分析过程仍比前面的例子涉及到更多的概率论知识。读者也可以跳过这一应用,而不会影响理解的连贯性。
1704419696
1704419697
[11] 在(2.2.4)式中,我们隐含了一个前提,即假定随机扰动项的密度f(ε)满足两个工人产出水平刚好相等的概率为0,从而在求得工人i期望效用时不必考虑这种情况。(较正式地说,我们假定密度函数f(ε)没有奇点)在对工作竞赛的完全分析中,专门分析由掷硬币决定优胜者或(在本模型中是等价的)每个工人得到(wH+wL)/2的情况是十分自然的(但对结果却无关紧要)。
1704419698
1704419699
[12] 贝叶斯法则提供了求p(A|B)的公式,即给定事件B已经发生条件下事件A发生的(条件)概率。令p(A)、p(B)和p(A,B)分别表示A发生、B发生和A、B同时发生的(先验)概率(即A和B都没有机会发生前的主观概率)。贝叶斯法则证明p(A|B)=p(A,B)/p(B)。也就是说,B发生时A发生的条件概率等于A和B同时发生的概率除以B发生的先验概率。
1704419700
1704419701
[13] 在阶段博弈G为完全信息动态博弈时类似结论同样成立。设G属于第2.1.A节所定义的完全且完美信息动态博弈,如果G有惟一的逆向归纳解,则G(T)有惟一的子博弈精炼解:其中每一阶段的结果都是G的逆向归纳解。类似地,设G为第2.2.A节定义的两阶段博弈,如果G有惟一的子博弈精炼解,则G(T)也有惟一的子博弈精炼解:G的子博弈精炼解重复进行T次。
1704419702
1704419703
[14] 严格地讲,我们只针对第2.2.A节定义的博弈类型定义了子博弈精炼解,两阶段囚徒困境属于这一类型,因为对每一个第一阶段博弈的可行结果,其余第二阶段博弈都有惟一的纳什均衡。而基于图2.3.3为阶段博弈的两阶段重复博弈不属于这一类型,因为其阶段博弈有多个纳什均衡。这里,我们不对子博弈精炼解的定义进行专门扩展,使之适用于所有两阶段博弈,其一因为定义所需的变动极微;其二,在第2.3.B节和第2.4.B节中将会用到更为一般的定义。
1704419704
1704419705
[15] 之所以说不严格,因为“重新谈判”意味着在第一阶段和第二阶段中间发生了交流(甚至是讨价还价)。如果此类行为是允许的,则它们应包含在对博弈的定义及分析之中。这里我们假定没有此类行为发生,因而“重新谈判”在此可理解为在内心对局势的分析。
1704419706
1704419707
[16] 开始时的无名氏定理分析了一个有限重复博弈的全部纳什均衡的收益。这一结论被称为无名氏定理,是因为尽管无人发表,但在50年代就已广为博弈论学者所知。弗里德曼(1971)的定理则分析了有限重复博弈的特定子博弈精炼纳什均衡的收益,由于应用了子博弈精炼纳什均衡,这一较纳什均衡条件更强的均衡概念,因而较当初的无名氏定理条件更强。不过当初的名字依然沿用下来:弗里德曼的定理(和此后的结论)有时称为无名氏定理,尽管在它们公开发表之前并未被博弈论学者所周知。
1704419708
1704419709
[17] 我们当然也可以基于一个动态阶段博弈定义一个重复博弈,本节我们将讨论限于静态的阶段博弈是为了尽可能简单地说明主要原理。在第2.3.D和第2.3.E节的应用中就有基于动态阶段博弈的重复博弈。
1704419710
1704419711
[18] 本书只给出扩展式的非正式描述,要进一步了解精确的理论,请参考克雷普斯和威尔逊(1982)。
1704419712
1704419713
[19] 这种用是否单节信息集区分完美信息和非完美信息的方法只限于完全信息的博弈,因为第4章将会讲到,完美但非完全信息博弈的扩展式表述就含有非单节的信息集,不过,在本章中,我们只讨论完全信息的情况。
1704419714
1704419715
[20] 为构建一个子博弈精炼纳什均衡,首先选定包含原博弈树终点节的所有的最小的子博弈(如果一个子博弈不再包含其他任何子博弈,该子博弈就是最小的)。其后,用这些子博弈的一个纳什均衡收益在原博弈树中替换掉这些子博弈,并把这些子博弈的初始节看成原博弈的终点节。选定包含了简化后博弈树所有终点节的最小的子博弈,并用这些子博弈的一个纳什均衡收益代替这些子博弈。用此方法从树的最末端逆推就可得到一个子博弈精炼纳什均衡,因为参与者的战略在每一个子博弈中都构成了纳什均衡(事实上,还是子博弈精炼纳什均衡)。
1704419716
1704419717
1704419718
1704419719
1704419721
博弈论基础 第3章 非完全信息静态博弈
1704419722
1704419723
从本章开始,我们研究 非完全信息博弈 ,有时也称为 贝叶斯博弈 。前面讲过,在一个完全信息博弈中,参与者的收益函数是共同知识;而在非完全信息博弈中,与之相反,至少有一个参与者不能确定另一参与者的收益函数。非完全信息静态博弈的一个常见例子是密封报价拍卖(sealed-bid auction):每一报价方知道自己对所售商品的估价,但不知道任何其他报价方对商品的估价;各方的报价放在密封的信封里上交,从而参与者的行动可以被看作是同时的。不过,绝大多数在经济领域非常有意思的贝叶斯博弈是动态的。我们在第4章将会看到,私人信息的存在十分自然地导致享有私人信息的一方试图去沟通(或者误导),同时也使得没有私人信息的一方试图去学习和反应。这些都是博弈中固有的动态因素。
1704419724
1704419725
第3.1节给出静态贝叶斯博弈的标准式表述和贝叶斯纳什均衡的定义。由于这些定义非常抽象并有些复杂,我们通过一个简单的例子——非对称信息下的古诺竞争——介绍主要思想。
1704419726
[
上一页 ]
[ :1.704419677e+09 ]
[
下一页 ]