打字猴:1.701036967e+09

1701036967

1701036968

1701036969

1701036970

1701036971 注：在零和博弈中，收益矩阵中的数字代表矩阵左方的局中人（本例中的爱丽丝）的收益（因为是零和博弈，当然也就代表了矩阵上方的局中人鲍勃的损失了）。如果是负数，说明矩阵上方的局中人获得收益（也就意味着爱丽丝的损失）。在非零和博弈中，每一个矩阵单元包含两个数字，分别对应每个局中人（如果局中人更多，那么矩阵将很难写出）。

1701036972

1701036973 显然，爱丽丝必须选择乘公共汽车，因为无论鲍勃如何选择，这至少等同于，甚至高于走路的收益。而鲍勃也会选择乘车，因为不管爱丽丝怎么做，这都会使他的损失最小。选择走路最多有可能出现一样的结果，但也有可能更糟。

1701036974

1701036975 当然，这个例子太简单了，完全用不着博弈论。下面来看一个来自真实的世界战争的例子——博弈论教材的经典案例之一。

1701036976

1701036977 在第二次世界大战中，乔治·肯尼将军得知日军将向新几内亚岛派遣一支补给护航舰队。盟军自然想炸沉这支舰队。但这支舰队可能有两条可行路线——一条到达新不列颠的北边，一条到达南边。

1701036978

1701036979 每条路线都需要3天的行程，所以，原则上说，盟军有3天的袭击敌军的时间。但是，天气影响不可排除。据天气预报，如果走北边路线，会有1天的阴雨天气，使袭击时间最多为2天；而南边路线一直是晴天，为3天时间的轰炸提供清晰的能见度。肯尼将军必须做出选择，是将侦察飞行队派往北边还是南边。如果选择南边，而敌军舰队却走北边的话，他就少了1天的袭击时间（而可行的袭击时间也仅有2天）。如果侦察队去了北边，在敌军舰队走南边的情况下仍然还有2天的袭击时间。

1701036980

1701036981 经过分析，得出收益矩阵。如下表，表中数字代表盟军的收益，即袭击的天数。

1701036982

1701036983

1701036984

1701036985

1701036986 如果只是从盟军的角度来看这个矩阵，并不能一眼看出采取了什么策略。但是从日军的角度出发，很容易得出走北边路线是唯一有意义的方案。如果日军舰队选择南边路线，至少要受到两天的袭击，甚至三天；但是如果选择北边，则最多受到两天袭击（有可能只有一天），这样和选择南边一样或者更好，而不会更差。肯尼将军因此可以肯定日军会让护送舰队走北线，这样一来，盟军当然只能派侦察飞行队也走北线了（事实上，日军最后的确走了北线，在盟军的炮轰下损失惨重）。

1701036987

1701036988 当然，合适的策略并不总是显而易见的。我们重新回到爱丽丝和鲍勃的例子，看看如果爱丽丝拒绝玩鲍勃的这个愚蠢的游戏，会发生什么。在知道如果玩鲍勃的游戏则无论如何也拿不回她的10美元时，爱丽丝会提出另一种玩法，这可让鲍勃费尽脑筋想策略了。

1701036989

1701036990 在爱丽丝的游戏里，他们连续在一个月里每个工作日去图书馆一次。如果两人都是乘车去的，那么鲍勃付爱丽丝3美元；两人都走路去，则付4美元。鲍勃乘车而爱丽丝走路去，因而爱丽丝后到，鲍勃付5美元；鲍勃走路而爱丽丝乘车，因而爱丽丝先到的话，鲍勃付6美元。是不是被搞糊涂了？不要紧，鲍勃也被搞糊涂了。看看下面的收益矩阵吧：

1701036991

1701036992

1701036993

1701036994

1701036995 鲍勃很快就意识到，这个游戏可不简单。如果他乘车去，则只需要付3美元，但是爱丽丝意识到这点后，就会走路去，这样鲍勃就得付5美元了。这样一来，鲍勃可能会决定走路去，因为这样一来，就有可能只付4美元了。可是爱丽丝也会算到这一点，这样她就会乘车，这样的话鲍勃可就得付6美元了。鲍勃和爱丽丝都不知道对方会怎么走，因而也就没有明显的“最佳”战略了。

1701036996

1701036997 不过，要记住这点，爱丽丝有要求这个游戏要重复的进行，总共20次，但并没有哪条规则说你必须每次都采取同样的策略（这就是纯策略了——永远不会改变的策略）。相反的，爱丽丝会意识到她应当采取混合策略，也就是说她会有时乘车，有时走路，这样就能让鲍勃猜不透了。当然鲍勃也会这样做，采取混合策略，让爱丽丝来猜他。

1701036998

1701036999 这其实就是冯·诺依曼天才见解的本质核心内容。在二人零和博弈中，你总是能找得到一种最佳策略，而在很多情况下，最佳策略即混合策略。

1701037000

1701037001 在这个特定的例子里，很容易得出爱丽丝和鲍勃的各自的最佳策略。记住，混合策略是一系列纯策略的混合，每一个纯策略被采用的百分比是特定的（或者说，有一个特定的概率）。因此鲍勃想要计算出选择走路和乘车的策略的比例，图书馆的一本古老的有关博弈论的书帮了他的忙。按照书中的理论，他会将爱丽丝选择走路时他采取每种策略的收益（也就是矩阵的第一行）和爱丽丝乘车时的收益（也就是第二行）进行比较，也就是从第一行中减去第二行（结果是-2和2，不过这里的负号无关紧要）。这两个数字决定了鲍勃选择两种策略的比例——2∶2，或者说50∶50（要注意了，这里第二列的数决定采取第一种策略的比例值，第一列的数决定第二种策略的比例值，只是在这个特殊的例子中两个数值是相同）。对于爱丽丝，就要用第一列减去第二列，得到-3和1（这里负号没有影响），因此她应该采取第二种策略（走路）是第一种策略（乘车）的3倍。

1701037002

1701037003 结果即为：爱丽丝应当在1/4的时间里乘车，另外的3/4的时间里走路，而鲍勃则应当1/2时间走路，1/2时间乘车。两人还应当利用一些合适的随机选择的方法来决定什么时候乘车，什么时候走路。鲍勃可以用抛硬币的方法来决定，而爱丽丝则可以用随机数表选择，或者是用游戏转轮，转盘上有3/4的区域对应走路，而1/4区域对应坐车。一旦其中任何一个人经常走路（或者乘车），那么另一方就可以做出更为有利的策略了。

1701037004

1701037005 记住，一定要让对方猜不透你的想法。正因为如此，在打扑克牌中，博弈论被浓缩为一定要故弄玄虚。如果你一有好牌就得意洋洋，坏牌就不吭声，对手就能很容易判断出你的牌了。

1701037006

1701037007 真正的扑克牌游戏是相当复杂的，无法用简单的博弈理论来分析。但是如果只考虑两个人玩一副牌的情况，如只有鲍勃和爱丽丝。并规定黑牌比红牌大。发牌之前，每人下底注5元，这样一局赌注总额就有10元了。爱丽丝先玩，她可以弃牌或者再加注3元，如果弃牌，两个人都将手中牌翻开，谁有黑牌谁赢（如果两人都有黑牌，或者都只有红牌，则两人平分赌注）。

1701037008

1701037009 如果爱丽丝再加注3元，鲍勃可以选择也加注3元跟注叫牌（赌注就有16元了）或者弃牌。如果他弃牌，则爱丽丝获得13元，如果他叫牌，则两人亮牌，看谁赢得那16元。

1701037010

1701037011 这样的话，如果爱丽丝手中是红牌，那她只能轮空，指望鲍勃同样也是红牌。但是如果她下注，鲍勃可能会认为她有黑牌。如果他刚好是红牌，就会弃牌，这样爱丽丝就会用一张红牌赢了鲍勃。所以说虚张声势有时会转败为胜。但是，也有可能是鲍勃知道爱丽丝是在虚张声势［毕竟她不是伍尔坎（Vulcan）］，这样他就会继续跟注了。

1701037012

1701037013 这样，问题就变成了爱丽丝该以多大的频率来虚张声势，而鲍勃又该以多大频率在她虚张声势时加注？也许天才的冯·诺依曼可以心算出这些结果，但是我想绝大多数人还是需要借助于博弈论的。

1701037014

1701037015 上面所举的这类博弈中，收益矩阵说明了两个局中人都有4种策略可选。爱丽丝可以永远地轮空，或永远下注，在红牌的时候轮空，黑牌的时候下注，或在黑牌的时候也轮空，红牌的时候也下注。鲍勃也可以这么做，永远弃牌，或永远跟注，或在红牌的时候弃牌，黑牌的时候跟注，或黑牌的时候弃牌，红牌的时候跟注。通过计算收益矩阵，可以知道爱丽丝应该在3/5的时间内下注，不论这时拿到的是什么牌，在另外的2/5的时间里，只有在拿到黑牌时才下注。相反的，鲍勃不管拿到什么牌，应该在爱丽丝下注的2/5的时间中跟注；在另外的3/5的时间里，就应该看牌行事了：红牌弃牌，黑牌跟注（顺便提一下，从博弈论的理论可以看出，这场博弈是不公的，如果爱丽丝总是先玩的话，她将得到特别的眷顾，运用博弈矩阵里所示的混合策略玩的话，能保证平均每把赢30美分）。

1701037016

[ 上一页 ] [ :1.701036967e+09 ] [ 下一页 ]