1701036967
1701036968
1701036969
1701036970
1701036971
注:在零和博弈中,收益矩阵中的数字代表矩阵左方的局中人(本例中的爱丽丝)的收益(因为是零和博弈,当然也就代表了矩阵上方的局中人鲍勃的损失了)。如果是负数,说明矩阵上方的局中人获得收益(也就意味着爱丽丝的损失)。在非零和博弈中,每一个矩阵单元包含两个数字,分别对应每个局中人(如果局中人更多,那么矩阵将很难写出)。
1701036972
1701036973
显然,爱丽丝必须选择乘公共汽车,因为无论鲍勃如何选择,这至少等同于,甚至高于走路的收益。而鲍勃也会选择乘车,因为不管爱丽丝怎么做,这都会使他的损失最小。选择走路最多有可能出现一样的结果,但也有可能更糟。
1701036974
1701036975
当然,这个例子太简单了,完全用不着博弈论。下面来看一个来自真实的世界战争的例子——博弈论教材的经典案例之一。
1701036976
1701036977
在第二次世界大战中,乔治·肯尼将军得知日军将向新几内亚岛派遣一支补给护航舰队。盟军自然想炸沉这支舰队。但这支舰队可能有两条可行路线——一条到达新不列颠的北边,一条到达南边。
1701036978
1701036979
每条路线都需要3天的行程,所以,原则上说,盟军有3天的袭击敌军的时间。但是,天气影响不可排除。据天气预报,如果走北边路线,会有1天的阴雨天气,使袭击时间最多为2天;而南边路线一直是晴天,为3天时间的轰炸提供清晰的能见度。肯尼将军必须做出选择,是将侦察飞行队派往北边还是南边。如果选择南边,而敌军舰队却走北边的话,他就少了1天的袭击时间(而可行的袭击时间也仅有2天)。如果侦察队去了北边,在敌军舰队走南边的情况下仍然还有2天的袭击时间。
1701036980
1701036981
经过分析,得出收益矩阵。如下表,表中数字代表盟军的收益,即袭击的天数。
1701036982
1701036983
1701036984
1701036985
1701036986
如果只是从盟军的角度来看这个矩阵,并不能一眼看出采取了什么策略。但是从日军的角度出发,很容易得出走北边路线是唯一有意义的方案。如果日军舰队选择南边路线,至少要受到两天的袭击,甚至三天;但是如果选择北边,则最多受到两天袭击(有可能只有一天),这样和选择南边一样或者更好,而不会更差。肯尼将军因此可以肯定日军会让护送舰队走北线,这样一来,盟军当然只能派侦察飞行队也走北线了(事实上,日军最后的确走了北线,在盟军的炮轰下损失惨重)。
1701036987
1701036988
当然,合适的策略并不总是显而易见的。我们重新回到爱丽丝和鲍勃的例子,看看如果爱丽丝拒绝玩鲍勃的这个愚蠢的游戏,会发生什么。在知道如果玩鲍勃的游戏则无论如何也拿不回她的10美元时,爱丽丝会提出另一种玩法,这可让鲍勃费尽脑筋想策略了。
1701036989
1701036990
在爱丽丝的游戏里,他们连续在一个月里每个工作日去图书馆一次。如果两人都是乘车去的,那么鲍勃付爱丽丝3美元;两人都走路去,则付4美元。鲍勃乘车而爱丽丝走路去,因而爱丽丝后到,鲍勃付5美元;鲍勃走路而爱丽丝乘车,因而爱丽丝先到的话,鲍勃付6美元。是不是被搞糊涂了?不要紧,鲍勃也被搞糊涂了。看看下面的收益矩阵吧:
1701036991
1701036992
1701036993
1701036994
1701036995
鲍勃很快就意识到,这个游戏可不简单。如果他乘车去,则只需要付3美元,但是爱丽丝意识到这点后,就会走路去,这样鲍勃就得付5美元了。这样一来,鲍勃可能会决定走路去,因为这样一来,就有可能只付4美元了。可是爱丽丝也会算到这一点,这样她就会乘车,这样的话鲍勃可就得付6美元了。鲍勃和爱丽丝都不知道对方会怎么走,因而也就没有明显的“最佳”战略了。
1701036996
1701036997
不过,要记住这点,爱丽丝有要求这个游戏要重复的进行,总共20次,但并没有哪条规则说你必须每次都采取同样的策略(这就是纯策略了——永远不会改变的策略)。相反的,爱丽丝会意识到她应当采取混合策略,也就是说她会有时乘车,有时走路,这样就能让鲍勃猜不透了。当然鲍勃也会这样做,采取混合策略,让爱丽丝来猜他。
1701036998
1701036999
这其实就是冯·诺依曼天才见解的本质核心内容。在二人零和博弈中,你总是能找得到一种最佳策略,而在很多情况下,最佳策略即混合策略。
1701037000
1701037001
在这个特定的例子里,很容易得出爱丽丝和鲍勃的各自的最佳策略。记住,混合策略是一系列纯策略的混合,每一个纯策略被采用的百分比是特定的(或者说,有一个特定的概率)。因此鲍勃想要计算出选择走路和乘车的策略的比例,图书馆的一本古老的有关博弈论的书帮了他的忙。按照书中的理论,他会将爱丽丝选择走路时他采取每种策略的收益(也就是矩阵的第一行)和爱丽丝乘车时的收益(也就是第二行)进行比较,也就是从第一行中减去第二行(结果是-2和2,不过这里的负号无关紧要)。这两个数字决定了鲍勃选择两种策略的比例——2∶2,或者说50∶50(要注意了,这里第二列的数决定采取第一种策略的比例值,第一列的数决定第二种策略的比例值,只是在这个特殊的例子中两个数值是相同)。对于爱丽丝,就要用第一列减去第二列,得到-3和1(这里负号没有影响),因此她应该采取第二种策略(走路)是第一种策略(乘车)的3倍。
1701037002
1701037003
结果即为:爱丽丝应当在1/4的时间里乘车,另外的3/4的时间里走路,而鲍勃则应当1/2时间走路,1/2时间乘车。两人还应当利用一些合适的随机选择的方法来决定什么时候乘车,什么时候走路。鲍勃可以用抛硬币的方法来决定,而爱丽丝则可以用随机数表选择,或者是用游戏转轮,转盘上有3/4的区域对应走路,而1/4区域对应坐车。一旦其中任何一个人经常走路(或者乘车),那么另一方就可以做出更为有利的策略了。
1701037004
1701037005
记住,一定要让对方猜不透你的想法。正因为如此,在打扑克牌中,博弈论被浓缩为一定要故弄玄虚。如果你一有好牌就得意洋洋,坏牌就不吭声,对手就能很容易判断出你的牌了。
1701037006
1701037007
真正的扑克牌游戏是相当复杂的,无法用简单的博弈理论来分析。但是如果只考虑两个人玩一副牌的情况,如只有鲍勃和爱丽丝。并规定黑牌比红牌大。发牌之前,每人下底注5元,这样一局赌注总额就有10元了。爱丽丝先玩,她可以弃牌或者再加注3元,如果弃牌,两个人都将手中牌翻开,谁有黑牌谁赢(如果两人都有黑牌,或者都只有红牌,则两人平分赌注)。
1701037008
1701037009
如果爱丽丝再加注3元,鲍勃可以选择也加注3元跟注叫牌(赌注就有16元了)或者弃牌。如果他弃牌,则爱丽丝获得13元,如果他叫牌,则两人亮牌,看谁赢得那16元。
1701037010
1701037011
这样的话,如果爱丽丝手中是红牌,那她只能轮空,指望鲍勃同样也是红牌。但是如果她下注,鲍勃可能会认为她有黑牌。如果他刚好是红牌,就会弃牌,这样爱丽丝就会用一张红牌赢了鲍勃。所以说虚张声势有时会转败为胜。但是,也有可能是鲍勃知道爱丽丝是在虚张声势[毕竟她不是伍尔坎(Vulcan)],这样他就会继续跟注了。
1701037012
1701037013
这样,问题就变成了爱丽丝该以多大的频率来虚张声势,而鲍勃又该以多大频率在她虚张声势时加注?也许天才的冯·诺依曼可以心算出这些结果,但是我想绝大多数人还是需要借助于博弈论的。
1701037014
1701037015
上面所举的这类博弈中,收益矩阵说明了两个局中人都有4种策略可选。爱丽丝可以永远地轮空,或永远下注,在红牌的时候轮空,黑牌的时候下注,或在黑牌的时候也轮空,红牌的时候也下注。鲍勃也可以这么做,永远弃牌,或永远跟注,或在红牌的时候弃牌,黑牌的时候跟注,或黑牌的时候弃牌,红牌的时候跟注。通过计算收益矩阵,可以知道爱丽丝应该在3/5的时间内下注,不论这时拿到的是什么牌,在另外的2/5的时间里,只有在拿到黑牌时才下注。相反的,鲍勃不管拿到什么牌,应该在爱丽丝下注的2/5的时间中跟注;在另外的3/5的时间里,就应该看牌行事了:红牌弃牌,黑牌跟注(顺便提一下,从博弈论的理论可以看出,这场博弈是不公的,如果爱丽丝总是先玩的话,她将得到特别的眷顾,运用博弈矩阵里所示的混合策略玩的话,能保证平均每把赢30美分)。
1701037016
[
上一页 ]
[ :1.701036967e+09 ]
[
下一页 ]