打字猴:1.704418193e+09

1704418193

1704418194

1704418195

1704418196

1704418197

1704418198 对S1中战略所有可能的概率分布P1都成立，并且必须满足

1704418199

1704418200

1704418201

1704418202

1704418203 对S2中战略所有可能的概率分布P2都成立。

1704418204

1704418205

1704418206 定义在两个参与者标准式博弈G={S1，S2；u1，u2}中，混合战略是纳什均衡的充要条件为：每一参与者的混合战略是另一参与者混合战略的最优反应，即（1.3.4）和（1.3.5）必须同时成立。

1704418207

1704418208 下面我们用这一定义分析猜硬币博弈和性别战博弈，为此，我们运用图1.3.3中介绍的图示法，把参与者i对参与者j混合战略的最优反应在图上表示出来。为完成图1.3.3的内容，还需计算最优的q值，用q*（r）表示，从而使（q，l-q）成为参与者2对参与者1战略（r，1-r）的最优反应。结果如图1.3.4所示，如果r＜1/2，则2的最优反应为背面，于是q*（r）=0；相似地，如果r＞1/2，则2的最优反应是正面，于是q*（r）=1。如果r=1/2，则不仅参与者2出正面和出背面是无差别的，而且对其所有混合战略（q，1-q）也都完全相同，于是q*（1/2）为整个区间[0，1]。

1704418209

1704418210

1704418211

1704418212

1704418213 图1.3.4

1704418214

1704418215 把图1.3.4的纵轴和横轴互换并旋转，我们得到图1.3.5。单纯表示参与者2对参与者1混合战略的最优反应，图1.3.5不如图1.3.4更加直观，但它可与图1.3.3合并成图1.3.6。图1.3.6和第1.2.A节分析古诺模型时的图1.2.1相类似，正如那里的最优反应函数r2（q1）和r1（q2）的交点确定了古诺博弈的纳什均衡，在这里最优反应对应r*（q）和q*（r）的交点给出了猜硬币博弈的混合战略纳什均衡：如果参与者i的战略是（1/2，1/2），则参与者j的最优反应为（1/2，1/2），它满足纳什均衡的要求。

1704418216

1704418217

1704418218

1704418219

1704418220 图1.3.5

1704418221

1704418222

1704418223

1704418224

1704418225 图1.3.6

1704418226

1704418227 应该强调的是，这样一个混合战略纳什均衡并不是建立在任何参与者扔硬币、掷骰子或其他随机选择行为的基础之上，我们可以把参与者j的混合战略解释为参与者i对参与者j将会选择哪一个（纯）战略的不确定性。例如在棒球比赛中，投球手也许是基于以往投球的成功率决定是投快速直线球还是投曲线球。如果击球手了解投球手是如何选择的，但并不能观察到他以往的成功率，那么击球手就可能会推断投球手投出快球和投出直线球的可能性是相等的。这时我们把击球手的推断表示为投球手采取混合战略（1/2，1/2），而事实上投球手是基于击球手所不了解的信息选择一个纯战略。更为一般地讲，我们可以理解为参与者j被赋予了一小点儿内部信息，基于他所掌握的内部信息，参与者j更倾向于选择某一相关的纯战略。不过，由于参与者i并不能观测到j的私人信息，i并不能确定j的选择，我们用j的混合战略表示i的这种不确定性。在第3.2.A节，我们还将为这种对混合战略的解释提供更为正式的表述。

1704418228

1704418229 作为混合战略纳什均衡的第二个例子，考虑第1.1.C节中的性别战博弈，令（q，1-q）为帕特的一个混合战略，其中他选择歌剧的概率为q，且令（r，1-r）为克里斯的一个混合战略，其中他选择歌剧的概率为r。如果帕特的战略为（q，1-q），则克里斯选择歌剧的期望收益为q×2+（1-q）×0=2q，选择拳击的期望收益为q×0+（l-q）×1=1-q。从而，在q＞1/3时，克里斯的最优反应为歌剧（即r=1）；q＜1/3时，克里斯的最优反应为拳击（即r=0）；q=l/3时，任何可行的r都是最优反应。类似地，如果克里斯的战略为（r，1-r），则帕特选择歌剧的期望收益为r×1+（1-r）×0=r，选择拳击的期望收益为r×0+（1-r）×2=2（1-r）。从而，r＞2/3时，帕特的最优反应是歌剧（即q=l）；r＜2/3时，帕特的最优反应是拳击（即q=0），r=2/3时，任何可行的q值都是最优反应。如图1.3.7所示，最优反应对应的交点之一，即帕特的混合战略（q，1-q）=（1/3，2/3）与克里斯的混合战略（r，1-r）=（2/3，1/3）就是原博弈的一个纳什均衡。

1704418230

1704418231

1704418232

1704418233

1704418234 图1.3.7

1704418235

1704418236 本例和图1.3.6的不同之处在于，后者两位参与者的最优反应对应只有一个交点，图1.3.7中r*（q）和q*（r）有三个交点：（q=0，r=0）、（q=1，r=1）及（q=1/3，r=2/3）。另外两个交点分别代表了第1.1.C节讲过的两个纯战略纳什均衡（拳击、拳击）和（歌剧，歌剧）。

1704418237

1704418238 在任何博弈中，一个纳什均衡（包括纯战略和混合战略均衡）都表现为参与者间最优反应对应的一个交点，即使该博弈的参与者在两人以上，或有些或全部参与者有两个以上的纯战略。不过遗憾的是，惟一一种可以用图形简明表示出参与者之间最优反应对应的博弈，就是上面介绍的每个参与者只有两个纯战略的两人博弈。下面我们用图示法论证任何这种两人博弈都存在纳什均衡（可能包含了混合战略）。

1704418239

1704418240

1704418241

1704418242

[ 上一页 ] [ :1.704418193e+09 ] [ 下一页 ]