打字猴:1.704418223e+09

1704418223

1704418224

1704418225 图1.3.6

1704418226

1704418227 应该强调的是，这样一个混合战略纳什均衡并不是建立在任何参与者扔硬币、掷骰子或其他随机选择行为的基础之上，我们可以把参与者j的混合战略解释为参与者i对参与者j将会选择哪一个（纯）战略的不确定性。例如在棒球比赛中，投球手也许是基于以往投球的成功率决定是投快速直线球还是投曲线球。如果击球手了解投球手是如何选择的，但并不能观察到他以往的成功率，那么击球手就可能会推断投球手投出快球和投出直线球的可能性是相等的。这时我们把击球手的推断表示为投球手采取混合战略（1/2，1/2），而事实上投球手是基于击球手所不了解的信息选择一个纯战略。更为一般地讲，我们可以理解为参与者j被赋予了一小点儿内部信息，基于他所掌握的内部信息，参与者j更倾向于选择某一相关的纯战略。不过，由于参与者i并不能观测到j的私人信息，i并不能确定j的选择，我们用j的混合战略表示i的这种不确定性。在第3.2.A节，我们还将为这种对混合战略的解释提供更为正式的表述。

1704418228

1704418229 作为混合战略纳什均衡的第二个例子，考虑第1.1.C节中的性别战博弈，令（q，1-q）为帕特的一个混合战略，其中他选择歌剧的概率为q，且令（r，1-r）为克里斯的一个混合战略，其中他选择歌剧的概率为r。如果帕特的战略为（q，1-q），则克里斯选择歌剧的期望收益为q×2+（1-q）×0=2q，选择拳击的期望收益为q×0+（l-q）×1=1-q。从而，在q＞1/3时，克里斯的最优反应为歌剧（即r=1）；q＜1/3时，克里斯的最优反应为拳击（即r=0）；q=l/3时，任何可行的r都是最优反应。类似地，如果克里斯的战略为（r，1-r），则帕特选择歌剧的期望收益为r×1+（1-r）×0=r，选择拳击的期望收益为r×0+（1-r）×2=2（1-r）。从而，r＞2/3时，帕特的最优反应是歌剧（即q=l）；r＜2/3时，帕特的最优反应是拳击（即q=0），r=2/3时，任何可行的q值都是最优反应。如图1.3.7所示，最优反应对应的交点之一，即帕特的混合战略（q，1-q）=（1/3，2/3）与克里斯的混合战略（r，1-r）=（2/3，1/3）就是原博弈的一个纳什均衡。

1704418230

1704418231

1704418232

1704418233

1704418234 图1.3.7

1704418235

1704418236 本例和图1.3.6的不同之处在于，后者两位参与者的最优反应对应只有一个交点，图1.3.7中r*（q）和q*（r）有三个交点：（q=0，r=0）、（q=1，r=1）及（q=1/3，r=2/3）。另外两个交点分别代表了第1.1.C节讲过的两个纯战略纳什均衡（拳击、拳击）和（歌剧，歌剧）。

1704418237

1704418238 在任何博弈中，一个纳什均衡（包括纯战略和混合战略均衡）都表现为参与者间最优反应对应的一个交点，即使该博弈的参与者在两人以上，或有些或全部参与者有两个以上的纯战略。不过遗憾的是，惟一一种可以用图形简明表示出参与者之间最优反应对应的博弈，就是上面介绍的每个参与者只有两个纯战略的两人博弈。下面我们用图示法论证任何这种两人博弈都存在纳什均衡（可能包含了混合战略）。

1704418239

1704418240

1704418241

1704418242

1704418243 图1.3.8

1704418244

1704418245 考虑图1.3.8给出的参与者1的收益情况。x和z，y和w各自的相对大小对博弈的结果十分重要，由此可以分为以下四种主要情况：（i）x＞z且y＞w，（ii）x＜z且y＜w（iii）x＞z且y＜w，（iv）x＜z且y＞w。我们首先讨论这四种主要情况，然后再分析涉及x=z或y=w时的情况。

1704418246

1704418247

1704418248

1704418249

1704418250 图1.3.9

1704418251

1704418252 对参与者1，在情况（i）中，上严格优于下；在情况（ii）中，下严格优于上。根据前面讲过的严格劣战略定义：当且仅当参与者i（对其他参与者所选择的战略）不能作出这样的推断，使选择战略si成为最优反应，则si为严格劣战略。因此，如果（q，1-q）是参与者2的一个混合战略，其中q为2选择左的概率，那么在情况（i）中，没有q能使参与者1选择下成为最优，并且在情况（ii）中，没有q能使1选择上成为最优。令（r，1-r）表示参与者1的一个混合战略，其中r是1选择上的概率，我们可以在图1.3.9中分别表示出情况（i）和情况（ii）下的最优反应对应。（在这两种情况下，最优反应对应事实上也是最优反应函数，因为没有q值使得参与者1有多个最优反应。）

1704418253

1704418254

1704418255

1704418256

1704418257 图1.3.10

1704418258

1704418259 在情况（iii）和情况（iv）中，上和下都不是严格劣战略，那么，必定对某些q值，选择上是最优的，对另一些q值，选择下是最优的。令q’=（w-y）/（x-z+w-y），那么在情况（iii）中，q＞q’时上是最优的，q＜q’时下最优；而在（iv）中则相反。在两种情况下，q=q’时，任何可行的r都是最优的。这两种情况的最优反应对应由图1.3.10给出。

1704418260

1704418261 由于x=z时，q’=1，而y=w时，q’=0，所有包含x=z或：y=w的情况下，最优反应对应将呈“L”状（即单位正方形中相邻的两条边）我们可设想图1.3.10中（iii）或（iv），在q’=0及q’=1时的情况。

1704418262

1704418263 在图1.3.8中分别加入任意的参与者2的收益值，经过与上面类似的计算可得同样的四个最优反应对应，只不过与图1.3.4相同，水平轴代表r值，而纵轴代表q值。做从1.3.4到1.3.5同样的处理，旋转这四个图形的坐标系，可以得到图1.3.11和图1.3.12（在图1.3.12中，对r’的定义与图1.3.10中q’类似）。

1704418264

1704418265 决定性的一点在于，给定参与者1的四种最优反应对应的任何一种，即图1.3.9或图1.3.10中的任何一条r*（q），及参与者2的任何四种之一，即图1.3.11或图1.3.12中的任何一条q*（r），这一组最优反应对应至少有一个交点，于是博弈至少有一个纳什均衡，对16种可能的最优反应对应组合情况进行逐一检验，我们留在习题中进行。这里只定性地给出可以得到的结论。可能出现的情况有：（1）惟一的纯战略纳什均衡，（2）惟一的混合战略纳什均衡，（3）两个纯战略纳什均衡和一个混合战略纳什均衡。前面讲过的图1.3.6的猜硬币博弈是第二种情况的一个例子，图1.3.7的性别战博弈是第三种情况的一个例子。囚徒困境则属于第一种情况，它是由r*（q）的（i）或（ii）和q*（r）的（i）或（ii）结合产生的。[15]

1704418266

1704418267

1704418268

1704418269

1704418270 图1.3.11

1704418271

1704418272

[ 上一页 ] [ :1.704418223e+09 ] [ 下一页 ]