1704418193
1704418194
1704418195
1704418196
1704418197
1704418198
对S1中战略所有可能的概率分布P1都成立,并且必须满足
1704418199
1704418200
1704418201
1704418202
1704418203
对S2中战略所有可能的概率分布P2都成立。
1704418204
1704418205
1704418206
定义 在两个参与者标准式博弈G={S1,S2;u1,u2}中,混合战略是纳什均衡的充要条件为:每一参与者的混合战略是另一参与者混合战略的最优反应,即(1.3.4)和(1.3.5)必须同时成立。
1704418207
1704418208
下面我们用这一定义分析猜硬币博弈和性别战博弈,为此,我们运用图1.3.3中介绍的图示法,把参与者i对参与者j混合战略的最优反应在图上表示出来。为完成图1.3.3的内容,还需计算最优的q值,用q*(r)表示,从而使(q,l-q)成为参与者2对参与者1战略(r,1-r)的最优反应。结果如图1.3.4所示,如果r<1/2,则2的最优反应为背面,于是q*(r)=0;相似地,如果r>1/2,则2的最优反应是正面,于是q*(r)=1。如果r=1/2,则不仅参与者2出正面和出背面是无差别的,而且对其所有混合战略(q,1-q)也都完全相同,于是q*(1/2)为整个区间[0,1]。
1704418209
1704418210
1704418211
1704418212
1704418213
图1.3.4
1704418214
1704418215
把图1.3.4的纵轴和横轴互换并旋转,我们得到图1.3.5。单纯表示参与者2对参与者1混合战略的最优反应,图1.3.5不如图1.3.4更加直观,但它可与图1.3.3合并成图1.3.6。图1.3.6和第1.2.A节分析古诺模型时的图1.2.1相类似,正如那里的最优反应函数r2(q1)和r1(q2)的交点确定了古诺博弈的纳什均衡,在这里最优反应对应r*(q)和q*(r)的交点给出了猜硬币博弈的混合战略纳什均衡:如果参与者i的战略是(1/2,1/2),则参与者j的最优反应为(1/2,1/2),它满足纳什均衡的要求。
1704418216
1704418217
1704418218
1704418219
1704418220
图1.3.5
1704418221
1704418222
1704418223
1704418224
1704418225
图1.3.6
1704418226
1704418227
应该强调的是,这样一个混合战略纳什均衡并不是建立在任何参与者扔硬币、掷骰子或其他随机选择行为的基础之上,我们可以把参与者j的混合战略解释为参与者i对参与者j将会选择哪一个(纯)战略的不确定性。例如在棒球比赛中,投球手也许是基于以往投球的成功率决定是投快速直线球还是投曲线球。如果击球手了解投球手是如何选择的,但并不能观察到他以往的成功率,那么击球手就可能会推断投球手投出快球和投出直线球的可能性是相等的。这时我们把击球手的推断表示为投球手采取混合战略(1/2,1/2),而事实上投球手是基于击球手所不了解的信息选择一个纯战略。更为一般地讲,我们可以理解为参与者j被赋予了一小点儿内部信息,基于他所掌握的内部信息,参与者j更倾向于选择某一相关的纯战略。不过,由于参与者i并不能观测到j的私人信息,i并不能确定j的选择,我们用j的混合战略表示i的这种不确定性。在第3.2.A节,我们还将为这种对混合战略的解释提供更为正式的表述。
1704418228
1704418229
作为混合战略纳什均衡的第二个例子,考虑第1.1.C节中的性别战博弈,令(q,1-q)为帕特的一个混合战略,其中他选择歌剧的概率为q,且令(r,1-r)为克里斯的一个混合战略,其中他选择歌剧的概率为r。如果帕特的战略为(q,1-q),则克里斯选择歌剧的期望收益为q×2+(1-q)×0=2q,选择拳击的期望收益为q×0+(l-q)×1=1-q。从而,在q>1/3时,克里斯的最优反应为歌剧(即r=1);q<1/3时,克里斯的最优反应为拳击(即r=0);q=l/3时,任何可行的r都是最优反应。类似地,如果克里斯的战略为(r,1-r),则帕特选择歌剧的期望收益为r×1+(1-r)×0=r,选择拳击的期望收益为r×0+(1-r)×2=2(1-r)。从而,r>2/3时,帕特的最优反应是歌剧(即q=l);r<2/3时,帕特的最优反应是拳击(即q=0),r=2/3时,任何可行的q值都是最优反应。如图1.3.7所示,最优反应对应的交点之一,即帕特的混合战略(q,1-q)=(1/3,2/3)与克里斯的混合战略(r,1-r)=(2/3,1/3)就是原博弈的一个纳什均衡。
1704418230
1704418231
1704418232
1704418233
1704418234
图1.3.7
1704418235
1704418236
本例和图1.3.6的不同之处在于,后者两位参与者的最优反应对应只有一个交点,图1.3.7中r*(q)和q*(r)有三个交点:(q=0,r=0)、(q=1,r=1)及(q=1/3,r=2/3)。另外两个交点分别代表了第1.1.C节讲过的两个纯战略纳什均衡(拳击、拳击)和(歌剧,歌剧)。
1704418237
1704418238
在任何博弈中,一个纳什均衡(包括纯战略和混合战略均衡)都表现为参与者间最优反应对应的一个交点,即使该博弈的参与者在两人以上,或有些或全部参与者有两个以上的纯战略。不过遗憾的是,惟一一种可以用图形简明表示出参与者之间最优反应对应的博弈,就是上面介绍的每个参与者只有两个纯战略的两人博弈。下面我们用图示法论证任何这种两人博弈都存在纳什均衡(可能包含了混合战略)。
1704418239
1704418240
1704418241
1704418242
[
上一页 ]
[ :1.704418193e+09 ]
[
下一页 ]