1701036983
1701036984
1701036985
1701036986
如果只是从盟军的角度来看这个矩阵,并不能一眼看出采取了什么策略。但是从日军的角度出发,很容易得出走北边路线是唯一有意义的方案。如果日军舰队选择南边路线,至少要受到两天的袭击,甚至三天;但是如果选择北边,则最多受到两天袭击(有可能只有一天),这样和选择南边一样或者更好,而不会更差。肯尼将军因此可以肯定日军会让护送舰队走北线,这样一来,盟军当然只能派侦察飞行队也走北线了(事实上,日军最后的确走了北线,在盟军的炮轰下损失惨重)。
1701036987
1701036988
当然,合适的策略并不总是显而易见的。我们重新回到爱丽丝和鲍勃的例子,看看如果爱丽丝拒绝玩鲍勃的这个愚蠢的游戏,会发生什么。在知道如果玩鲍勃的游戏则无论如何也拿不回她的10美元时,爱丽丝会提出另一种玩法,这可让鲍勃费尽脑筋想策略了。
1701036989
1701036990
在爱丽丝的游戏里,他们连续在一个月里每个工作日去图书馆一次。如果两人都是乘车去的,那么鲍勃付爱丽丝3美元;两人都走路去,则付4美元。鲍勃乘车而爱丽丝走路去,因而爱丽丝后到,鲍勃付5美元;鲍勃走路而爱丽丝乘车,因而爱丽丝先到的话,鲍勃付6美元。是不是被搞糊涂了?不要紧,鲍勃也被搞糊涂了。看看下面的收益矩阵吧:
1701036991
1701036992
1701036993
1701036994
1701036995
鲍勃很快就意识到,这个游戏可不简单。如果他乘车去,则只需要付3美元,但是爱丽丝意识到这点后,就会走路去,这样鲍勃就得付5美元了。这样一来,鲍勃可能会决定走路去,因为这样一来,就有可能只付4美元了。可是爱丽丝也会算到这一点,这样她就会乘车,这样的话鲍勃可就得付6美元了。鲍勃和爱丽丝都不知道对方会怎么走,因而也就没有明显的“最佳”战略了。
1701036996
1701036997
不过,要记住这点,爱丽丝有要求这个游戏要重复的进行,总共20次,但并没有哪条规则说你必须每次都采取同样的策略(这就是纯策略了——永远不会改变的策略)。相反的,爱丽丝会意识到她应当采取混合策略,也就是说她会有时乘车,有时走路,这样就能让鲍勃猜不透了。当然鲍勃也会这样做,采取混合策略,让爱丽丝来猜他。
1701036998
1701036999
这其实就是冯·诺依曼天才见解的本质核心内容。在二人零和博弈中,你总是能找得到一种最佳策略,而在很多情况下,最佳策略即混合策略。
1701037000
1701037001
在这个特定的例子里,很容易得出爱丽丝和鲍勃的各自的最佳策略。记住,混合策略是一系列纯策略的混合,每一个纯策略被采用的百分比是特定的(或者说,有一个特定的概率)。因此鲍勃想要计算出选择走路和乘车的策略的比例,图书馆的一本古老的有关博弈论的书帮了他的忙。按照书中的理论,他会将爱丽丝选择走路时他采取每种策略的收益(也就是矩阵的第一行)和爱丽丝乘车时的收益(也就是第二行)进行比较,也就是从第一行中减去第二行(结果是-2和2,不过这里的负号无关紧要)。这两个数字决定了鲍勃选择两种策略的比例——2∶2,或者说50∶50(要注意了,这里第二列的数决定采取第一种策略的比例值,第一列的数决定第二种策略的比例值,只是在这个特殊的例子中两个数值是相同)。对于爱丽丝,就要用第一列减去第二列,得到-3和1(这里负号没有影响),因此她应该采取第二种策略(走路)是第一种策略(乘车)的3倍。
1701037002
1701037003
结果即为:爱丽丝应当在1/4的时间里乘车,另外的3/4的时间里走路,而鲍勃则应当1/2时间走路,1/2时间乘车。两人还应当利用一些合适的随机选择的方法来决定什么时候乘车,什么时候走路。鲍勃可以用抛硬币的方法来决定,而爱丽丝则可以用随机数表选择,或者是用游戏转轮,转盘上有3/4的区域对应走路,而1/4区域对应坐车。一旦其中任何一个人经常走路(或者乘车),那么另一方就可以做出更为有利的策略了。
1701037004
1701037005
记住,一定要让对方猜不透你的想法。正因为如此,在打扑克牌中,博弈论被浓缩为一定要故弄玄虚。如果你一有好牌就得意洋洋,坏牌就不吭声,对手就能很容易判断出你的牌了。
1701037006
1701037007
真正的扑克牌游戏是相当复杂的,无法用简单的博弈理论来分析。但是如果只考虑两个人玩一副牌的情况,如只有鲍勃和爱丽丝。并规定黑牌比红牌大。发牌之前,每人下底注5元,这样一局赌注总额就有10元了。爱丽丝先玩,她可以弃牌或者再加注3元,如果弃牌,两个人都将手中牌翻开,谁有黑牌谁赢(如果两人都有黑牌,或者都只有红牌,则两人平分赌注)。
1701037008
1701037009
如果爱丽丝再加注3元,鲍勃可以选择也加注3元跟注叫牌(赌注就有16元了)或者弃牌。如果他弃牌,则爱丽丝获得13元,如果他叫牌,则两人亮牌,看谁赢得那16元。
1701037010
1701037011
这样的话,如果爱丽丝手中是红牌,那她只能轮空,指望鲍勃同样也是红牌。但是如果她下注,鲍勃可能会认为她有黑牌。如果他刚好是红牌,就会弃牌,这样爱丽丝就会用一张红牌赢了鲍勃。所以说虚张声势有时会转败为胜。但是,也有可能是鲍勃知道爱丽丝是在虚张声势[毕竟她不是伍尔坎(Vulcan)],这样他就会继续跟注了。
1701037012
1701037013
这样,问题就变成了爱丽丝该以多大的频率来虚张声势,而鲍勃又该以多大频率在她虚张声势时加注?也许天才的冯·诺依曼可以心算出这些结果,但是我想绝大多数人还是需要借助于博弈论的。
1701037014
1701037015
上面所举的这类博弈中,收益矩阵说明了两个局中人都有4种策略可选。爱丽丝可以永远地轮空,或永远下注,在红牌的时候轮空,黑牌的时候下注,或在黑牌的时候也轮空,红牌的时候也下注。鲍勃也可以这么做,永远弃牌,或永远跟注,或在红牌的时候弃牌,黑牌的时候跟注,或黑牌的时候弃牌,红牌的时候跟注。通过计算收益矩阵,可以知道爱丽丝应该在3/5的时间内下注,不论这时拿到的是什么牌,在另外的2/5的时间里,只有在拿到黑牌时才下注。相反的,鲍勃不管拿到什么牌,应该在爱丽丝下注的2/5的时间中跟注;在另外的3/5的时间里,就应该看牌行事了:红牌弃牌,黑牌跟注(顺便提一下,从博弈论的理论可以看出,这场博弈是不公的,如果爱丽丝总是先玩的话,她将得到特别的眷顾,运用博弈矩阵里所示的混合策略玩的话,能保证平均每把赢30美分)。
1701037016
1701037017
利用随机方法,从多种纯策略中进行选择并组成混合策略的思想正是冯·诺依曼证明最小最大化原理中的本质核心内容。通过选择正确的混合策略,在对手也精通博弈论的情况下,能够保证你获得可能获得的最大收益。如果对手不懂博弈论,那你可能会收益更大。
1701037018
1701037020
第七节 不仅仅是游戏
1701037021
1701037022
博弈论并不仅仅针对扑克牌或象棋游戏,甚至不仅仅关于经济学。它讨论的是做决策性的决定——不论是在经济中还是现实生活中的任何其他领域。任何人与人之间为了追求某种目标而相互竞争并交互作用的场合都是博弈论的用武之地,它可以清楚地描述使用各种不同策略所预期达到的结果。一旦你明确想要得到的结果,博弈论就可以计算出最合理的策略来实现它。如果你也赞同下面这个观点,即一群相互影响的人都在寻找他们的最佳策略,以获取自己心中渴望的东西,那么认为博弈论潜在地与指导人类行为的自然法则这个现代的观点相关就不难接受了。
1701037023
1701037024
冯·诺依曼和摩根斯特恩在书中并没有提及“自然法则”,但的确暗示了博弈论是对社会组织中的“社会秩序”或“行为标准”的描述。并且,他们还花重墨讲述了“社会现象理论”如何需要一种像博弈论中的数学一样,不同于物理学中所使用的数学方法。他们写道:“博弈策略中的数学理论的确很有说服力,因为它的概念与社会组织的概念存在着相通相似”。
1701037025
1701037026
不过,在最初阶段,博弈论只是被局限于处理真实世界中策略问题的一种工具。在现实生活中,你可以找到二人零和博弈的例子,但是这种例子要么简单得根本不需要动用博弈论,要么就是太复杂,博弈论根本无法考虑周全。
1701037027
1701037028
当然,指望一本书能够提出一个全新领域并解决这个领域内的所有问题,有些不现实。所以,在将博弈论应用于比二人零和博弈更复杂的情况时,冯·诺依曼和摩根斯特恩并不完全成功也就情有可原了。不过,没过不久,博弈论的力量就得到了实质性的加强,而这一切,要归功于约翰·纳什(John Forbes Nash)所带来的美丽的数学。
1701037029
1701037030
1701037031
1701037032
[
上一页 ]
[ :1.701036983e+09 ]
[
下一页 ]