打字猴:1.704639966e+09
1704639966 这个博弈有两个纯粹策略的纳什均衡:(U,L)与(D,R)。但是还有一个混合策略的纳什均衡。由前述定理,可知,如游戏者B选策略L的概率为q,选策略R的概率为1-q;则A的收益应满足
1704639967
1704639968
1704639969
1704639970
1704639971 如果游戏者A选策略U的概率为p,选策略D的概率为1-p,则B的收益应满足
1704639972
1704639973
1704639974
1704639975
1704639976
1704639977 从式(10.7),可知
1704639978
1704639979
1704639980 从式(10.8),可知
1704639981
1704639982
1704639983
1704639984 因此,与便是一个混合策略的纳什均衡。
1704639985
1704639986 对于混合策略的纳什均衡,通常有两种解释。一种是,游戏者选择策略时本来就不是确定无疑的,而是具有一定的随机性。所以,在不同的策略之间的选择就带有概率。第二,混合策略是游戏者对于对手的策略选择的猜测,这种猜测的命中率当然带有偶然性。当双方对对方的策略选择都猜中时,双方也就各自达到了自身利益的极大化,这便是纳什均衡的含义。
1704639987
1704639988 二、最大最小化策略(max min stratesy)
1704639989
1704639990 这是一种保守的策略,又是风险比较小的策略。当游戏者想回避风险时,他会采取该策略。请看下列博弈:
1704639991
1704639992 表10.8 最大最小策略
1704639993
1704639994
1704639995
1704639996
1704639997 两个游戏者A与B,如果B是理性的,就肯定会选择“右”,因“右”是占优于“左”的。如果A相信B是理性的,则A必定会选“下”,最后达到使A与B都收益极大化的结果(2,1)。
1704639998
1704639999 但是,A这样决策时会有风险:如果B是以损害A为目标,则B知道A会选择“下”时会故意选择“左”,尽管B这样做自己并没有什么好处,反而比选“右”少得一单位利益,但B达到了损害A最厉害的目标。A如果估计到这一可能性,则还是保守一点为妙,具体做法是“两害之间取其轻”,即“最大最小策略”
1704640000
1704640001
1704640002
1704640003
1704640004 A的决策是从两个坏结果中挑一个相对好一些的结果。
1704640005
1704640006
1704640007
1704640008
1704640009 所以,A会选择“上”。
1704640010
1704640011 如果B仍想以损害A为目标,这时便不可能得逞,只好选择“右”。结果会是(上,右)。
1704640012
1704640013 要注意的是,A如选择max min策略,结果就不是“收益极大化”,但却确保了“风险极小化”,这一目标得以实现。从这一意义上,max min策略又称为是保守策略。
1704640014
1704640015 还应指出,表10.8所示的并不是一个零和博弈,所以纳什均衡与“最大最小策略均衡”不同。在高级的博弈论课程里,会证明,若一个博弈是零和博弈,若存在“最大最小策略均衡”,则该均衡必等同于纳什均衡。
[ 上一页 ]  [ :1.704639966e+09 ]  [ 下一页 ]