1701033170
1701033171
(2)策略的多样性
1701033172
1701033173
策略总是多个的,这意味着你其实有很多个策略可以选择。“人不犯我,我不犯人;人若犯我,我必犯人”只是一个策略,但不是唯一能够选择的策略。其他可选择的策略包括:“人不犯我,我不犯人;人若犯我,我也不犯人”,“人不犯我,我要犯人;人若犯我,我不犯人”,“人不犯我,我要犯人;人若犯我,我更要犯人”。因此,这里共有4个策略可以供你选择。策略的数量取决于信息的数量和行动的数量,是两者的乘积。如果你会遇到N种情况,每种情况下可以有M种行为选择,那么,你可以选择的策略数量就是N×M个。
1701033174
1701033175
在人类漫长的进化过程中,许多策略(特别是那些严格劣势策略)都被淘汰了,甚至只留下唯一的策略,如“见了老虎就跑”,“见有人挥拳过来就躲开”等。这些策略,已经转化为一个人的本能反应。但是,一定不要忘记的是,你永远不可能别无选择,因为你至少可以不做选择。不行善可以,作孽不可以!不说真话可以,说假话不可以!
1701033176
1701033177
(3)策略的不可观察性
1701033178
1701033179
策略不同于行动,行动是具体的做法,策略是对行动的预想,因此,行动是可观察的,策略却是不可观察的。你可以看到对方怎么做,但是不一定了解对方是怎么想的。很多年前,曾经听到过这样一件事,让笔者一直印象深刻。美国的一位脱口秀主持人在主持节目的时候,问到一个小男孩:“如果你是一个机长,你驾驶的飞机在半空中忽然没有油了,你准备怎么办?”小男孩脱口而出:“我马上跳伞,离开飞机。”所有的成人哄堂大笑。主持人本来也准备笑了,可是他忽然注意到小男孩眼中闪闪的泪光和悲悯,是的,是悲悯。接着他听到震撼他心灵的一句话,孩子说:“我要去拿油料回来!”
1701033180
1701033181
有人认为可以通过人的行为来观察他的策略,其实这是不完全的,因为不同的策略也可能有相同的行动。譬如,“人不犯我,我不犯人;人若犯我,我必犯人”和“人不犯我,我不犯人;人若犯我,我也不犯人”是两种不同的策略。当“人不犯我”时,如果我都表现出“我不犯人”的行动,那么对手仍难以判断我的具体策略是什么。因此,只是根据行动推测策略可能是有误的。
1701033182
1701033183
好的策略是建立在对于可见事实的洞察与不可见变数的预见之上的。我们往往面临很多问题、很多事实、很多信息,但是对那些现象之间的联系以及何为关键联系,决定了能否精炼出有效的策略。我们需要对于未来最有可能的变化元素以及影响变化的条件因素的趋向进行预测与模拟,预备是形成策略应变能力的基本心理要求。在百米竞技中,必须先有一个预备的动作要求,以实现枪响后的快速启动,并导致抢跑事件的频频发生。一般来说,策略依托四个相关的认识论要素:多种多样的知识与经验,丰富和全面的想象力,出奇甚至超强的联系构建能力,合理地在现实条件下梳理与过滤策略可操作性的能力。[5] 如果把博弈理解为人与人之间的比拼,那么运筹帷幄的能力决定了千里之外的胜负!
1701033184
1701033185
5.损益(payoff)
1701033186
1701033187
损益是指参与者的得与失,这是参与者最为看重的东西。对应于各参与者的每一组可能的决策选择,博弈都有一个结果表示各参与者在该策略下的所得或所失,这些可能结果的量化数值,就是各参与者在相应情况下的“损益”。之所以称为损益,是因为结果既可能是收益(用正值表示),也可以是损失(用负值表示),它们是分析博弈模型的标准和基础。在本书的行文中,有时候也会把损益称为收益或者支付。
1701033188
1701033189
与策略不同的是,损益是可以观测的,并在数量上是可以比较的。如果没有特别说明,在本书后续的分析中,损益经常用货币的数量来表示。当然,在许多博弈中,最后的得失并不是金钱,而是金钱以外的收益(如开心、幸福感、公平感、荣誉感、成就感等)或损失(如沮丧、懊恼、悔恨、悲痛等),但为了分析的方便,更多时候仍然用不同大小的数值来进行度量。譬如调查问卷中常会出现这样的量表设计:非常满意=2,比较满意=1,一般=0,不太满意=-1,很不满意=-2。
1701033190
1701033191
还需要特别指出的是,在博弈分析中,重要的往往不是数值的绝对大小,而是数值之间的相互关系。换句话说,你或许难以测算出阅读本书的愉悦程度的大小,但是,你一定知道阅读本书后,是比之前更开心了,还是更不开心了,或者没有变化。
1701033192
1701033193
6.结局(outcome)
1701033194
1701033195
结局是指所有参与者选择了各自的策略(及其相应的行动)以后的结果。可以是指某种策略的组合,如两个人去打猎时共同商定一旦遇见狮子就联合进攻。也可以是指某种行动的组合,如两个人遇见狮子后的结果是一个往东狂奔、一个往西狂奔。也可以是指损益的组合,如最后一个被狮子吃掉了,另一个活了下来。
1701033196
1701033197
在一个博弈中,结局会有很多个,如果是指策略的组合,那么,N个参与者,每个人有M个策略,则总共有(N-1)×M×M个可能的结局。
1701033198
1701033199
7.均衡(equilibrium)
1701033200
1701033201
均衡是指所有博弈参与者的最优策略组合。它是特指某类结局,在该类结局中,参与者已经无法通过改变自身的策略(及其行为)选择来增加收益(效用)。基于纳什对博弈论的巨大贡献,我们在博弈论的分析中经常把均衡称之为纳什均衡。纳什均衡的含义就是:给定你的策略,我的策略就是对我而言的最好策略(或之一);给定我的策略,你的策略也是对你来说是最好的策略(或之一),即双方在对方给定的策略下已经没有积极性调整自己已选的策略。换言之,这是一种“没有人愿意偏离”的状态,因为缺乏偏离的激励,因此,只要约束条件不变,均衡的状态就不会变。由此可见,均衡是一种相对稳固的状态,但也因此会出现所谓的“现状的暴政”(tyranny of the status quo),即维持现状已成为一种常态或习惯,它的力量非常强大,以至于改变现状往往很难。这就不难理解,为什么改革需要理由,不改革却不需要任何理由。如果你想推动一个组织的变革,请先找好一个能够打动人的理由。因此,改革往往需要强有力的推动力。也因此,很多社会改革往往是由危机推动的。
1701033202
1701033203
均衡是我们唯一能够认知的状态。并没有所谓的“均衡”和“非均衡”的区别,只有某个均衡持续时间的差异。证券交易过程中的每个成交价都是一个均衡价格。直到被新的买卖力量所打破。赫拉克利特那条生生不息、永远流动的河流,只有凝固成一颗颗静止的水珠才能被人类所认知。均衡分析是人还没有成为上帝之前认识世界的唯一途径,否则,世界(自然的或社会的)就如同瞬息万变的河流,永远是不可捉摸、难以理解并无法把握的。
1701033204
1701033205
虽然均衡是指所有博弈参与者的最优策略组合,但是并不意味着均衡是参与者希望得到的最优结果。后续有关囚犯困境的分析表明,有时候均衡恰恰是一个对双方而言最差的结果。你或许会问:既然最差,为什么大家都不愿意去改变呢?道理很简单,因为没有人愿意去改变。试想,在北京,有多少私家车主愿意骑自行车去上班呢?
1701033206
1701033207
8.博弈的规则(rules of the game)
1701033208
1701033209
“参与者、行动和结果合起来称为博弈的规则。”[6] 博弈规则必须明确说明参与者是“谁”、每个参与者可使用的选择变量是“什么”,以及参与者群体所作的一组选择中,每个参与者会从中得到“多少”。通俗地说,规则规定了游戏可以怎么玩。从另一个角度看,规则就是一种限制,一种人为的限制,包括对参与者的资格限制,对行动空间(选择空间)的限制等。
1701033210
1701033211
博弈的规则决定了参与者的策略(行动)选择,并最终决定了博弈的结果。很多时候,游戏规则直接决定了游戏的结果,这揭示了游戏规则对游戏结果的决定性影响。如果你一定要问:“博弈的规则从何而来”?那么我告诉你,规则也是博弈的结果。正如4个人聚在一起打牌,肯定是先商量打什么牌,是“双扣”、“红五”,还是“斗地主”?如果输赢有奖惩,那么奖惩的内容是什么?钱,脸上贴纸,还是钻桌子?如果是钱,数量是多少?只有把这些东西都规定好以后,才能开始打牌。所以,作为一个博弈的参与者,你必须牢记一点:博弈之前你就已经开始博弈了!打牌不是从抓牌的时候开始的,而是从商量规则的时候开始的,甚至是从你找谁和你一起打牌的时候就开始了。
1701033212
1701033213
博弈的规则决定了每个参与者未来的能力发展方向。如果你有极大的力量,那么应该制定博弈的规则;如果你有较大的力量,那么可以挑选适合自己的博弈规则;如果你缺乏足够的力量,那么只能努力适应博弈的规则;如果你真的无法适应博弈的规则,那么只能遗憾地告诉你:“你out了!”
1701033214
1701033215
[1] 很遗憾,一直没有找到这个例子的最初出处。
1701033216
1701033217
[2] 当然,如果直接观测行动的成本很高,参与者可以选择间接的方式进行观测。在不完全信息的博弈中对此有专门的介绍。
1701033218
1701033219
[3] 补充说一句,在交通规则中取消黄灯的作用,是不科学的,这没有考虑到物理学中的惯性原理。
[
上一页 ]
[ :1.70103317e+09 ]
[
下一页 ]