打字猴:1.704418172e+09
1704418172 且参与者1选择混合战略P1(Ρ11,…,Ρ1J)的期望收益为:
1704418173
1704418174
1704418175
1704418176
1704418177 其中,Ρ1j×Ρ2k表示参与者选择s1j且参与者2选择s2k的概率。根据(1.3.3),参与者1选择混合战略P1的期望收益,等于按(1.3.2)给出的每一个纯战略{s11,…,s1J}的期望收益的加权和,其权重分别为各自的概率(Ρ11,…,Ρ1J),那么,参与者1的混合战略(Ρ11,…,Ρ1J)要成为他对参与者2战略P2的最优反应,其中任何大于0的Ρ1j相对应的纯战略必须满足:
1704418178
1704418179
1704418180
1704418181
1704418182 对S1中每一个s’1j都成立。这表明,一个混合战略要成为P2的最优反应,混合战略中每一个概率大于0的纯战略本身也必须是对P2的最优反应。反过来讲,如果参与者1有n个纯战略都是P2的最优反应,则这些纯战略全部或部分的任意线性组合(同时其他纯战略的概率为0)形成的混合战略同样是参与者1对P2的最优反应。
1704418183
1704418184 为给出扩展的纳什均衡的正式定义,我们还需要计算当参与者1和2分别选择混合战略P1和P2时参与者2的期望收益。如果参与者2推断参与者1将分别以(Ρ11,…,Ρ1J)的概率选择战略{s11,…,s1J}则参与者2分别以概率(Ρ21,…,Ρ2k)选择战略(s21,…,s2k)时的期望收益为
1704418185
1704418186
1704418187
1704418188
1704418189
1704418190
1704418191
1704418192 在给出υ1(P1,P2)和P2)后,我们可以重新表述纳什均衡的必要条件,即每一参与者的混合战略是另一参与者混合战略的最优反应:一对混合战略(,)要成为纳什均衡,必须满足
1704418193
1704418194
1704418195
1704418196
1704418197
1704418198 对S1中战略所有可能的概率分布P1都成立,并且必须满足
1704418199
1704418200
1704418201
1704418202
1704418203 对S2中战略所有可能的概率分布P2都成立。
1704418204
1704418205
1704418206 定义 在两个参与者标准式博弈G={S1,S2;u1,u2}中,混合战略是纳什均衡的充要条件为:每一参与者的混合战略是另一参与者混合战略的最优反应,即(1.3.4)和(1.3.5)必须同时成立。
1704418207
1704418208 下面我们用这一定义分析猜硬币博弈和性别战博弈,为此,我们运用图1.3.3中介绍的图示法,把参与者i对参与者j混合战略的最优反应在图上表示出来。为完成图1.3.3的内容,还需计算最优的q值,用q*(r)表示,从而使(q,l-q)成为参与者2对参与者1战略(r,1-r)的最优反应。结果如图1.3.4所示,如果r<1/2,则2的最优反应为背面,于是q*(r)=0;相似地,如果r>1/2,则2的最优反应是正面,于是q*(r)=1。如果r=1/2,则不仅参与者2出正面和出背面是无差别的,而且对其所有混合战略(q,1-q)也都完全相同,于是q*(1/2)为整个区间[0,1]。
1704418209
1704418210
1704418211
1704418212
1704418213 图1.3.4
1704418214
1704418215 把图1.3.4的纵轴和横轴互换并旋转,我们得到图1.3.5。单纯表示参与者2对参与者1混合战略的最优反应,图1.3.5不如图1.3.4更加直观,但它可与图1.3.3合并成图1.3.6。图1.3.6和第1.2.A节分析古诺模型时的图1.2.1相类似,正如那里的最优反应函数r2(q1)和r1(q2)的交点确定了古诺博弈的纳什均衡,在这里最优反应对应r*(q)和q*(r)的交点给出了猜硬币博弈的混合战略纳什均衡:如果参与者i的战略是(1/2,1/2),则参与者j的最优反应为(1/2,1/2),它满足纳什均衡的要求。
1704418216
1704418217
1704418218
1704418219
1704418220 图1.3.5
1704418221
[ 上一页 ]  [ :1.704418172e+09 ]  [ 下一页 ]