1701034869
1701034870
2.石头、剪子、布
1701034871
1701034872
“石头、剪子、布”的起源有四种说法,大多数人认同中国起源说,也有人认为它起源于日本、非洲或者爱尔兰。根据史料记载,这个游戏很可能是起源于中国,然后传到日本、韩国、欧洲等地。中国从汉代就有猜拳游戏,而其他国家都不具备产生这种游戏的土壤和相关历史。“石头、剪子、布”作为猜拳的一种,根据明人谢肇浙所撰的《五杂俎》一书,猜拳的传统可以追溯到汉朝的手势令。明李日华《六研斋笔记》载云:“俗饮,以手指屈伸相搏,谓之豁拳,又名豁指头。”在明清小说中,相关记载更多。《红楼梦》第六十三回写道:“彼此有了三分酒,便猜拳赢唱小曲儿。”《水浒传》第一百零九回写道:“猜拳豁指头,大碗价吃酒。”清朝人赵翼有诗云:“老拳轰拇阵,谜语斗阄戏。”
1701034873
1701034874
根据博弈论,最优玩法其实就是一种随机的选择,因此,当排除心理因素后,这是一个简单并且直观的游戏,就如同和计算机玩一样。但是,这里所说的“最优”是指不存在有比期望的随机概率更好的玩法。然而,对手如果不是采用“最优”策略,而是采用某种“次优”策略的话,采用随机玩法并不一定是最好的玩法。事实上,如果对手是人或者非随机程序的话,那么几乎可以肯定他采用的是某种“次优”策略,这种情况下,针对对手的弱点可以设计出一个更好的策略。基于这种思路而设计的Roshambot计算机程序,轻松击败了人类玩家(甚至包括它的开发者Perry Friedman,他曾经在2001年8月击败7名对手,其中包括前世界扑克大赛冠军Phil Hellmuth,并赢得800美元的奖金)。阿尔伯塔大学的扑克选手Darse Billings组织了一个Roshambot程序大赛,希望能够通过这种活动研究这些非随机事件的概率,以及它们在计算机游戏中的其他各种应用(例如,在扑克游戏中,推测对手的各种非随机出牌模式是游戏过程中的一个重要策略)。
1701034875
1701034876
真正的石头、剪子、布的比赛是一个有趣的心理学较量。石头、剪子、布的策略是随机地选一个,但是人类不能达到真正随机,所以比赛的技术在于利用对手的非随机性。某些有经验的选手能连续取得比赛胜利,证明了技术能影响比赛结果。众所周知,在打扑克、打麻将的时候,经常出现刚刚明白规则的新手第一次玩就赢了身经百战的老手的现象。在我们各地对这种普遍的现象也有熟语说明。这到底是怎么回事呢?这真的是像熟语说的“臭手摸好牌”?其实不是这样的,这是个混合策略的问题。新手因为刚刚理解规则,对游戏的技巧一无所知。所以他的策略有着很强的不可预测性,而老手因为经常打牌,所以他的手段和策略已经变得比较纯熟,易于预测。就像我们很容易预测一个正常人的动机,但是很难预测一个疯子的行为。
1701034877
1701034878
总之,当你的策略变得随机,对方就没有规律可以研究,那么这个博弈就进入了一个混合策略纳什均衡。
1701034879
1701034880
3.点球大战
1701034881
1701034882
在足球比赛中,在比赛必须分出胜负的情况下(例如各种一场决胜负的杯赛),如果双方在经过90分钟激战和加时赛(有时不进行加时赛)仍然无法分出胜负,采取的是以互罚点球决胜负的残酷方法,这就称为点球大战。
1701034883
1701034884
点球大战开始后,双方各自先确定本队罚点球的球员顺序,然后双方依确定好的顺序将各自罚点球的前5名球员派出参加第1轮的点球互罚。5轮之后如果分出了胜负,那么点球大战结束,全场比赛结束;假如5轮过后双方仍为平手,那么就接着进行点球互罚,双方依次派出1名球员罚点球,直到分出胜负为止。
1701034885
1701034886
在每一次射门时,攻方的策略是:攻左边,或攻右边。守方的策略是:守左边,或守右边(以守方的方向为准)(见表13.1)。
1701034887
1701034888
表13.1 点球大战
1701034889
1701034890
1701034891
1701034892
1701034893
不难看出,在这个博弈中,以上的4个结局都不是纳什均衡,也就是说这个博弈并没有一个纯策略的纳什均衡,只有一个混合策略的纳什均衡。
1701034894
1701034895
1701034896
1701034897
1701034899
用博弈的思维看世界 二、若干实例分析
1701034900
1701034901
1.仁慈的教授
1701034902
1701034903
在大学里面,考试失误是个非常普遍的现象。其实,很多教授是很仁慈的,在学生的再三恳求下,他们会放过这些可怜的学生们。但是事实上,他们想放过的仅仅是平时认真但是在最后的考试中发挥失利的同学。对于那种天天不听讲、只打游戏、不务正业的学生,教授当然想给他们一个不及格,让他们从中吸取教训,以后能够努力学习(见表13.2)。
1701034904
1701034905
表13.2 仁慈的教授
1701034906
1701034907
1701034908
1701034909
1701034910
很显然,如果教授知道张三平时是勤快的,教授一定会放过张三。但是,如果张三预先知道了教授会放过自己,张三会选择平时偷懒,因为平时偷懒的收益更大。双方博弈的结果是:如果张三平时偷懒,教授选择不放过;如果教授选择不放过,张三选择平时勤快;如果张三选择平时勤快,教授选择放过;如果教授选择放过,张三选择平时偷懒。于是,这个博弈中的4个结果都不是均衡的结果。对此,我们可以按照概率的思想去思考。试想,教授如果认为张三有20%的可能性是勤快的,有80%的可能性是懒惰的,那么教授放过他的收益为:3×0.2-1×0.8=-0.2。教授不放过他的收益为:-1×0.2+0×0.8=-0.2。
1701034911
1701034912
通过计算表明,是否放过张三对教授来说是一样的(期望收益一样,因为已经涉及了概率的问题,只能计算期望收益)。因此,如果张三偷懒的可能大于80%,教授一定不会放过他;如果张三偷懒的可能小于80%(勤快的概率大于20%),教授一定会选择放过他。
1701034913
1701034914
同理,对张三来说,如果他认为教授放过他的可能为50%,不放过他的可能为50%,那么,他选择懒惰的期望收益为:3×0.5+0×0.5=-1.5。他选择勤快的期望收益为:2×0.5+1×0.5=-1.5。
1701034915
1701034916
此时对张三来说,选择勤快和选择懒惰的期望收益相同。那么在张三看来,当教授会放过自己的概率大于50%,就选择平时偷懒,小于50%就选择平时勤快。由此,不难发现这个博弈的混合策略的均衡结构就是张三以80%的可能性懒惰,20%的可能性勤快;教授50%的可能性会放过,50%的可能性不放过。
1701034917
1701034918
这个博弈还可以用函数图像来理解。
[
上一页 ]
[ :1.701034869e+09 ]
[
下一页 ]