打字猴:1.704639966e+09

1704639966 这个博弈有两个纯粹策略的纳什均衡：（U，L）与（D，R）。但是还有一个混合策略的纳什均衡。由前述定理，可知，如游戏者B选策略L的概率为q，选策略R的概率为1－q；则A的收益应满足

1704639967

1704639968

1704639969

1704639970

1704639971 如果游戏者A选策略U的概率为p，选策略D的概率为1－p，则B的收益应满足

1704639972

1704639973

1704639974

1704639975

1704639976

1704639977 从式（10.7），可知

1704639978

1704639979

1704639980 从式（10.8），可知

1704639981

1704639982

1704639983

1704639984 因此，与便是一个混合策略的纳什均衡。

1704639985

1704639986 对于混合策略的纳什均衡，通常有两种解释。一种是，游戏者选择策略时本来就不是确定无疑的，而是具有一定的随机性。所以，在不同的策略之间的选择就带有概率。第二，混合策略是游戏者对于对手的策略选择的猜测，这种猜测的命中率当然带有偶然性。当双方对对方的策略选择都猜中时，双方也就各自达到了自身利益的极大化，这便是纳什均衡的含义。

1704639987

1704639988 二、最大最小化策略（max min stratesy）

1704639989

1704639990 这是一种保守的策略，又是风险比较小的策略。当游戏者想回避风险时，他会采取该策略。请看下列博弈：

1704639991

1704639992 表10.8　最大最小策略

1704639993

1704639994

1704639995

1704639996

1704639997 两个游戏者A与B，如果B是理性的，就肯定会选择“右”，因“右”是占优于“左”的。如果A相信B是理性的，则A必定会选“下”，最后达到使A与B都收益极大化的结果（2，1）。

1704639998

1704639999 但是，A这样决策时会有风险：如果B是以损害A为目标，则B知道A会选择“下”时会故意选择“左”，尽管B这样做自己并没有什么好处，反而比选“右”少得一单位利益，但B达到了损害A最厉害的目标。A如果估计到这一可能性，则还是保守一点为妙，具体做法是“两害之间取其轻”，即“最大最小策略”

1704640000

1704640001

1704640002

1704640003

1704640004 A的决策是从两个坏结果中挑一个相对好一些的结果。

1704640005

1704640006

1704640007

1704640008

1704640009 所以，A会选择“上”。

1704640010

1704640011 如果B仍想以损害A为目标，这时便不可能得逞，只好选择“右”。结果会是（上，右）。

1704640012

1704640013 要注意的是，A如选择max min策略，结果就不是“收益极大化”，但却确保了“风险极小化”，这一目标得以实现。从这一意义上，max min策略又称为是保守策略。

1704640014

1704640015 还应指出，表10.8所示的并不是一个零和博弈，所以纳什均衡与“最大最小策略均衡”不同。在高级的博弈论课程里，会证明，若一个博弈是零和博弈，若存在“最大最小策略均衡”，则该均衡必等同于纳什均衡。

[ 上一页 ] [ :1.704639966e+09 ] [ 下一页 ]