1704639917
第四节 混合策略与最大最小(max min)策略
1704639918
1704639919
一、混合策略
1704639920
1704639921
我们在第二节里看到,“石头、布、剪刀”博弈中,在收益矩阵中我们找不到一格是代表均衡结果的。但如果我们从随机的角度来看策略选择,仍能发现均衡。
1704639922
1704639923
例6:请考虑下列博弈(见表10.6)。如果每一个游戏者完全清楚地知道对手将会采取什么样的策略,则不会出现均衡。A如知道B会选择F,则会选择C;B如知道A会选择C,则会选择C;A若知道B会选择C,则会选择F…,如此反复,以至无穷,仍不会有最终的均衡结果。
1704639924
1704639925
表10.6 斗争(F)与妥协(C)
1704639926
1704639927
1704639928
1704639929
1704639930
1704639931
1704639932
1704639933
1704639934
1704639935
1704639936
1704639937
1704639938
但是,如果把策略的选择随机化,则我们会得到Nash均衡。如果B在策略F与策略C之间进行选择的概率密度各为则如A选择F,A的效用就为如A选择C,A的效用仍为可见,当游戏者B选择F与C的概率各为时,游戏者A选择F与C的效用是相同的,这说明A在这种条件下的最大效用为零,并且对F与C无差异。给定游戏者A对策略F与C无差别,说明A会以概率去选择策略F与C。但是,如果A以概率去选择策略F与C,则游戏者B在F与C之间也是无差异的,而且也达到了效用极大化(=0)。这就说明,如果游戏者A与B都以的概率来选择F与C,则他们各自都达到效用极大化。
1704639939
1704639940
我们定义混合策略如下:
1704639941
1704639942
对于游戏者i,其一个混合策略是一个概率密度函数σi∶Si→R,使得,对于所有的si∈Si,都有
1704639943
1704639944
1704639945
1704639946
1704639947
这就是说,游戏者i的混合策略是m个密度函数(如果游戏者i有m个可能的策略选择的话)。如第i个游戏者只有两个可能的策略选择,则其混合策略就只是p与(1-p)两个概率。
1704639948
1704639949
对于i来说,所有的σi的集合记为Mi={σi}。
1704639950
1704639951
1704639952
【定义】 混合策略纳什均衡:如果对于博弈中所有的游戏者i,对于所有的σi∈Mi,都有则称σ*为一个混合策略的纳什均衡。
1704639953
1704639954
1704639955
【定理】 如果σ*是一个混合策略的纳什均衡,则对于具有σi给定的正概率的每一个策略si∈Si,都有ui(σ*)=ui(si,)。(证明从略)
1704639956
1704639957
这个定理告诉我们:如果存在混合策略的纳什均衡,则当si具有发生的正概率(由i的混合策略给定)时,游戏者对于其可能选择的每一个纯粹策略si都是无差异的。根据这一定理,我们就很容易找出混合策略均衡。
1704639958
1704639959
例7:考虑下列博弈:
1704639960
1704639961
表10.7
1704639962
1704639963
1704639964
1704639965
[
上一页 ]
[ :1.704639916e+09 ]
[
下一页 ]