1704419870
1704419871
1704419873
博弈论基础 3.2 应用举例
1704419874
1704419876
3.2.A 再谈混合战略
1704419877
1704419878
我们在第1.3.A节已提到,豪尔绍尼(1973)提出参与者j的混合战略代表了参与者i对j所选择的纯战略的不确定性,而j的选择又依赖于他所掌握的一小点儿私人信息。现在,我们可以给出这种观点的精确表述:完全信息博弈的混合战略纳什均衡(几乎总是)可以解释为与之密切相关、存在一小点非完全信息的博弈中的纯战略贝叶斯纳什均衡(我们忽略不能够由此解释的极为罕见的情况)。用更容易理解的话讲,混合战略纳什均衡的重要特征,不是参与者j随机地选择一个战略,而是参与者i不能确定j的选择,这种不确定性既可产生于随机因素,又可能(更为合理地)因为一小点儿私人信息,如下面的例子。
1704419879
1704419880
回顾第1章所讲的性别战博弈,存在两个纯战略纳什均衡(歌剧,歌剧)和(拳击,拳击)及一个混合战略纳什均衡,其中克里斯以2/3的概率选择歌剧,帕特以2/3的概率选择拳击。
1704419881
1704419882
1704419883
1704419884
1704419885
性别战
1704419886
1704419887
现在假设尽管两人已经认识了相当一段时间,但克里斯和帕特仍不能确定对方收益函数的情况。具体地说,假定如果双方都选择歌剧克里斯的收益为2+tc,其中tc的值是克里斯的私人信息,双方都去观看拳击时帕特的收益为2+tp,其中tp的值为帕特的私人信息;tc和tp相互独立,并服从[0,x]区间上的均匀分布(至于选择[0,x]区间的均匀分布并不重要,只要记住tc和tp的值是指原博弈收益的随机扰动项,我们可以认为x是一个很小的正数)。所有其他情况下的收益不变。表述为标准式则为:静态贝叶斯博弈G={Ac,Ap,Tc,Tp,pc,pp,uc,up}中,行动空间为Ac=Ap={歌剧,拳击},类型空间为TC=TP=[0,x],关于类型的推断为对所有的tc和tp,Pc(tp)=pp(tc)=l/x收益情况如下图。
1704419888
1704419889
1704419890
1704419891
1704419892
非完全信息性别战
1704419893
1704419894
我们将构建出这一非完全信息性别战博弈的纯战略贝叶斯纳什均衡,其中克里斯在tc超过某临界值c时选择歌剧,否则选择拳击;帕特在tp超过某临界值p时选择拳击,否则选择歌剧。在这一均衡中,克里斯以(x-c)/x的概率选择歌剧,帕特则以(x-p)/x的概率选择拳击。我们将证明随非完全信息的逐渐消失(即随x的值趋于0),参与者在这一纯战略贝叶斯纳什均衡中的行为,逐渐与原博弈完全信息条件下混合战略纳什均衡中的行为相一致,也就是随x的值趋于0,(x-c)/x及(x-p)/x都将趋于2/3。
1704419895
1704419896
假设克里斯和帕特都采用上面所给出的战略,对一个给定的x,我们计算相应的c和p,以使双方的战略符合贝叶斯纳什均衡的条件。给定帕特的战略,克里斯选择歌剧和选择拳击的期望收益分别为
1704419897
1704419898
1704419899
1704419900
1704419901
与
1704419902
1704419903
1704419904
1704419905
1704419906
从而,当且仅当
1704419907
1704419908
1704419909
1704419910
1704419911
时选择歌剧是最优的。相似地,给定克里斯的战略,帕特选择拳击和选择歌剧的期望收益分别为
1704419912
1704419913
1704419914
1704419915
1704419916
与
1704419917
1704419918
1704419919
[
上一页 ]
[ :1.70441987e+09 ]
[
下一页 ]