打字猴:1.701034859e+09

1701034859 用博弈的思维看世界 [:1701032807]

1701034860 一、概念及说明

1701034861

1701034862 纳什均衡分为两种，如果一个策略规定参与者在每一个给定信息的情况下只选择一种特定的行动，我们称该策略为“纯策略”。相反，如果一个策略规定参与者在给定信息情况下以某种概率分布随机地选择不同的行动，我们就称该策略为混合策略。

1701034863

1701034864 混合策略是对每个纯策略分配一个概率而形成的策略。混合策略允许参与者随机选择一个纯策略。因为概率是连续的，所以即使策略集合是有限的，也会有无限多个混合策略。当然，每个纯策略其实都是一个“退化”的混合策略，某一特定纯策略的概率为1，其他的则为0。完全混合策略对每个纯策略都分配了一个不为零的概率。

1701034865

1701034866 1.随机药物检测

1701034867

1701034868 奥林匹克运动会中随机药物检测“群体”由比赛运动员和国际奥林匹克委员会（IOC）组成。双方的直接相互作用来自两方面，一方面是运动员之间的相互作用，他们需要作出在训练安排中和比赛前是否服用禁药的决策；另一方面是运动员与IOC之间的相互作用，后者需要维护运动的声誉。“理性策略”的应用需要运动员将获胜的机会以及如果服用了兴奋剂之后被逮到的机会之间进行比较而作出决策。类似的，IOC也会根据检测成本和清白声誉的价值而制定药物检测的程序和相应的惩罚措施。双方博弈的结果是IOC随机抽检，一些服药的运动员幸运地逃脱了，一些运气没那么好的运动员被发现了。

1701034869

1701034870 2.石头、剪子、布

1701034871

1701034872 “石头、剪子、布”的起源有四种说法，大多数人认同中国起源说，也有人认为它起源于日本、非洲或者爱尔兰。根据史料记载，这个游戏很可能是起源于中国，然后传到日本、韩国、欧洲等地。中国从汉代就有猜拳游戏，而其他国家都不具备产生这种游戏的土壤和相关历史。“石头、剪子、布”作为猜拳的一种，根据明人谢肇浙所撰的《五杂俎》一书，猜拳的传统可以追溯到汉朝的手势令。明李日华《六研斋笔记》载云：“俗饮，以手指屈伸相搏，谓之豁拳，又名豁指头。”在明清小说中，相关记载更多。《红楼梦》第六十三回写道：“彼此有了三分酒，便猜拳赢唱小曲儿。”《水浒传》第一百零九回写道：“猜拳豁指头，大碗价吃酒。”清朝人赵翼有诗云：“老拳轰拇阵，谜语斗阄戏。”

1701034873

1701034874 根据博弈论，最优玩法其实就是一种随机的选择，因此，当排除心理因素后，这是一个简单并且直观的游戏，就如同和计算机玩一样。但是，这里所说的“最优”是指不存在有比期望的随机概率更好的玩法。然而，对手如果不是采用“最优”策略，而是采用某种“次优”策略的话，采用随机玩法并不一定是最好的玩法。事实上，如果对手是人或者非随机程序的话，那么几乎可以肯定他采用的是某种“次优”策略，这种情况下，针对对手的弱点可以设计出一个更好的策略。基于这种思路而设计的Roshambot计算机程序，轻松击败了人类玩家（甚至包括它的开发者Perry Friedman，他曾经在2001年8月击败7名对手，其中包括前世界扑克大赛冠军Phil Hellmuth，并赢得800美元的奖金）。阿尔伯塔大学的扑克选手Darse Billings组织了一个Roshambot程序大赛，希望能够通过这种活动研究这些非随机事件的概率，以及它们在计算机游戏中的其他各种应用（例如，在扑克游戏中，推测对手的各种非随机出牌模式是游戏过程中的一个重要策略）。

1701034875

1701034876 真正的石头、剪子、布的比赛是一个有趣的心理学较量。石头、剪子、布的策略是随机地选一个，但是人类不能达到真正随机，所以比赛的技术在于利用对手的非随机性。某些有经验的选手能连续取得比赛胜利，证明了技术能影响比赛结果。众所周知，在打扑克、打麻将的时候，经常出现刚刚明白规则的新手第一次玩就赢了身经百战的老手的现象。在我们各地对这种普遍的现象也有熟语说明。这到底是怎么回事呢？这真的是像熟语说的“臭手摸好牌”？其实不是这样的，这是个混合策略的问题。新手因为刚刚理解规则，对游戏的技巧一无所知。所以他的策略有着很强的不可预测性，而老手因为经常打牌，所以他的手段和策略已经变得比较纯熟，易于预测。就像我们很容易预测一个正常人的动机，但是很难预测一个疯子的行为。

1701034877

1701034878 总之，当你的策略变得随机，对方就没有规律可以研究，那么这个博弈就进入了一个混合策略纳什均衡。

1701034879

1701034880 3.点球大战

1701034881

1701034882 在足球比赛中，在比赛必须分出胜负的情况下（例如各种一场决胜负的杯赛），如果双方在经过90分钟激战和加时赛（有时不进行加时赛）仍然无法分出胜负，采取的是以互罚点球决胜负的残酷方法，这就称为点球大战。

1701034883

1701034884 点球大战开始后，双方各自先确定本队罚点球的球员顺序，然后双方依确定好的顺序将各自罚点球的前5名球员派出参加第1轮的点球互罚。5轮之后如果分出了胜负，那么点球大战结束，全场比赛结束；假如5轮过后双方仍为平手，那么就接着进行点球互罚，双方依次派出1名球员罚点球，直到分出胜负为止。

1701034885

1701034886 在每一次射门时，攻方的策略是：攻左边，或攻右边。守方的策略是：守左边，或守右边（以守方的方向为准）（见表13.1）。

1701034887

1701034888 表13.1　点球大战

1701034889

1701034890

1701034891

1701034892

1701034893 不难看出，在这个博弈中，以上的4个结局都不是纳什均衡，也就是说这个博弈并没有一个纯策略的纳什均衡，只有一个混合策略的纳什均衡。

1701034894

1701034895

1701034896

1701034897

1701034898 用博弈的思维看世界 [:1701032808]

1701034899 用博弈的思维看世界二、若干实例分析

1701034900

1701034901 1.仁慈的教授

1701034902

1701034903 在大学里面，考试失误是个非常普遍的现象。其实，很多教授是很仁慈的，在学生的再三恳求下，他们会放过这些可怜的学生们。但是事实上，他们想放过的仅仅是平时认真但是在最后的考试中发挥失利的同学。对于那种天天不听讲、只打游戏、不务正业的学生，教授当然想给他们一个不及格，让他们从中吸取教训，以后能够努力学习（见表13.2）。

1701034904

1701034905 表13.2　仁慈的教授

1701034906

1701034907

1701034908

[ 上一页 ] [ :1.701034859e+09 ] [ 下一页 ]