1701037109
“均衡点,”他在博士论文中写道,“意味着…在其他玩家的策略不变时,每个玩家采取的混合策略都最大化其自身收益。”换句话说,在博弈中至少存在着这样一种策略组合,如果你改变你的策略(其他任何人的策略都不改变)你会获得比之前差的结果。更通俗地讲,经济学家罗伯特·韦伯(Robert Weber)表示,你可以说“纳什均衡描述了一个没有人犯错的世界是什么样子的。”或者像萨缪尔·鲍尔斯(Samuel Bowles)向我形容的那样,纳什均衡“是一种在其他人的状态给定的条件下,每个人都尽其所能,做到最好。”
1701037110
1701037111
冯·诺依曼对纳什的结果不以为然,因为它的确使博弈论转向了不同的方向。但是最终很多人还是意识到纳什理论的闪光点和有效性。“纳什均衡的概念可能是博弈论中唯一最基础的概念,”鲍尔斯宣称,“绝对的基础。”
1701037112
1701037114
第四节 博弈论的成长
1701037115
1701037116
纳什很快发表了他的均衡理论。1950年的《美国国家科学院院刊》刊登了他一篇简短的(两页)题为《多人博弈中的均衡点》的文章。文章简要地(虽然对非数学家来说不是特别清楚)说明了多人博弈“解”的存在性(解意指存在一组策略,使得没有任何玩家能通过单方面改变其策略而获得更多的收益)。他把这篇文章扩展为他的博士论文,并在1951年的《数学年刊》上发表了名为《非合作博弈》的长文版。
1701037117
1701037118
纳什在他的文章中客气地指出,冯·诺依曼和摩根斯特恩已经建立了一种“富有成效”的二人零和博弈理论。但是,他们的多人博弈理论则仅限用于纳什所讲的“合作”博弈,也就是说它仅限于分析由玩家组成的联盟之间的交互。“我们的理论与此相反,它是建立在没有联盟的基础上的,因为我们假定每个参与者都独立决策,不与其他任何人合作或交流。”换句话说,纳什设想出一种多人博弈的“自私自利”的版本,这也正是他称其为“非合作”博弈论的原因。当你仔细考虑这个理论时,就会发现它很好地概括了很多社会现象。在一个竞争激烈的世界中,纳什均衡描述了每个自利的人如何实现他可能的最大收益。“纳什得出的非合作博弈和合作博弈的区别对这个可能的实现起决定性作用。”博弈论理论家哈罗德·库恩(Harold Kuhn)这样写道。
1701037119
1701037120
对我来说,纳什均衡的真正关键之处在于它将博弈论数学和物理定律进行了类比——博弈论描绘社会系统,物理定律描绘自然系统。在自然界中,每个事物都寻求稳态,也就是寻求一种能量最小的状态。岩石从山峰上滚落因为在山峰上的岩石具有巨大的势能,它滚下山释放了这种能量,这是万有引力的作用。在化学反应中,所有的原子都在寻求一种稳定的、拥有最小能量的排列,这是缘于热力学定律。
1701037121
1701037122
正如在化学反应中所有的原子同时在寻求一个能量最小化的状态一样,在一个经济系统中,所有人都在寻求利益最大化。一个化学反应会达到热力学定律作用所规范的均衡;一个经济系统也将达到博弈论所描述的纳什均衡。
1701037123
1701037124
当然,现实生活并非如此简单。经常存在着复杂的影响因素。一辆推土机可以将岩石推回山上;你可以对一些分子添加化学药品来催化新的反应。当人的因素被包含进来时,各种新的不可预见性使博弈论发挥的领域变得更加复杂(想象一下如果分子能够思考,化学反应将变得多么难以捉摸)。
1701037125
1701037126
然而,纳什的均衡观念却抓住了社会的一个关键特征。运用纳什的数学方法,你可以和适当情形下的博弈作比较,从而得出人们如何在一个社会情境中达到稳态。因此如果你想将博弈论应用于现实生活,你需要设定一种能体现你所关注的现实生活情境本质特征的博弈。而且,即使你不曾注意到,生活中也包含了各种各样的情境需要我们来应对。
1701037127
1701037128
因此,博弈论理论家们已经设计出了比你在Toys R Us玩具店能买到的玩具还要多的博弈。细读博弈论的文献,你便会发现便士匹配博弈、小鸡博弈、公共物品博弈和性别大战,还有猎鹿博弈、最后通牒博弈和“长吸管”博弈,以及数以百计的其他博弈。但至今这些博弈中最有名的是一个被称为“囚徒困境”的博弈。
1701037129
1701037131
第五节 背叛还是合作
1701037132
1701037133
如同在我所有的书里一样,埃德加·爱伦·坡(Edgar Allan Poe)又一次预见了问题的关键点。在《玛丽罗热疑案》中,爱伦·坡描述了一起谋杀案,杜宾侦探相信它是由一个团伙所为。杜宾的策略是以豁免的机会诱使团伙中的第一个成员坦白。“团伙中的每一个人,在这种处境下,并不十分……渴望逃跑,而是害怕背叛,”坡的侦探这样推理,“他急切地更早地背叛,这样他自己就不会被背叛。”很遗憾,爱伦·坡(实际上他本身是个训练有素的数学家)没有思考过如何解决这种背叛问题的数学——否则他可能早在一百年前就提出了博弈论。
1701037134
1701037135
事实上,纳什在普林斯顿的教授,阿尔伯特·乌·塔克(Albert W.Tucker),于1950年第一次在博弈论中描述了囚徒困境。那时塔克正在斯坦福访问,他提到了自己对博弈论的兴趣。塔克意想不到地被邀请在一个研讨会上发言,因此他很快地想到了两名罪犯被警察抓住并被分开审问的场景。
1701037136
1701037137
就像你想的那样,警察们有足够的证据证明两名罪犯次要罪行,但是要使持枪抢劫的主要罪行成立还需要其中一个人来揭发他的同伙。因此,如果两个人都保持沉默,将分别被判一年的刑。但是不管其中的哪个人揭发了同伙,他就将被释放。如果只有一个人招供,他的同伙将被判5年。如果两个人相互出卖,将都被判3年的刑(由于坦白从宽减免两年)。
1701037138
1701037139
鲍勃和爱丽丝被判入狱的年限
1701037140
1701037141
1701037142
1701037143
1701037144
看到这个博弈矩阵,你将很容易找到纳什均衡。只在一种选择组合下两人都没有改变决策的动机——他们相互背叛。让我们仔细考虑一下。假设我们的博弈专家爱丽丝和鲍勃决定犯罪,但是警察抓住了他们。警察对鲍勃进行审讯,并告知了博弈的规则。鲍勃必须马上做出决定。他要考虑爱丽丝会做什么决策。如果爱丽丝出卖了他——据他对爱丽丝的了解,这很有可能——他最好的选择是也出卖她,因此他将只被判3年而不是5年。但如果爱丽丝保持沉默,他的最佳选择依然是出卖她,那样他将被释放。无论爱丽丝选择了什么策略,鲍勃的最佳选择都是背叛,正如艾伦·坡的侦探所觉察到的那样。很明显的,爱丽丝也会像鲍勃一样推断。唯一稳定的结果是两个人都坦白,出卖他们的同伙。
1701037145
1701037146
具有讽刺意味的是,这个问题之所以被称为困境,是因为如果两人都保持沉默,双方的境况都会更好一些。但是他们被分开审讯,不允许互相交流。因此单个人的最佳选择并不能导致团队的最佳选择。如果他们都保持沉默(也就是,他们相互合作),他们总共会在狱中度过两年(每人各1年)。如果一个人出卖了同伙(专业术语是背叛),而另一个人保持沉默,他们总共被判5年(全部由保持沉默的那个人承担)。但当他们相互背叛,他们总共被判六年——和其他所有策略组合相比在总体上是最坏的结果。纳什均衡——个人利益驱动下做出的稳定的策略组合——产生了一个更差的总体收益。从博弈论和纳什的数学方法来看,这种选择是明确的。如果每个人的动机是获得最大的个人利益,恰当的选择就是背叛。
1701037147
1701037148
当然,在现实生活中你永远不知道会发生什么,因为背叛者可能有其他的考虑(例如如果错误地出卖了同伙他们可能也会难逃一劫)。因此,纳什的均衡计算并不总能够预测事实上人们会如何行动。有时人们为公平起见而调整了他们的策略,而有时则出于恶意来做决定。在囚徒困境的情形中,一些人确实会选择合作。但这样并没有贬低了纳什均衡的重要性,正如经济学家查尔斯·霍尔特(Charles Holt)和阿尔文·罗斯(Alvin Roth)所指出的那样,“纳什均衡的用处不只局限于其能准确预测人们如何在博弈中行动,即使不能预测时它也非常有用,”他们写道,“因为此时纳什均衡可以辨别出什么情况下个人动机和其他动机之间存在着紧张关系。”所以如果人们在囚徒困境情况下合作(至少开始是合作)时,纳什的数学方法告诉我们这种合作“因为不是一种均衡,所以不稳定,以致很难维持下去。”
1701037149
1701037150
虽然囚徒困境只是现实生活的简化,但是它确实体现了诸多社会交互的本质。但显然你不能通过计算纳什均衡来轻易地估计任何社会情况。现实生活中的博弈通常涉及很多人和复杂的利益规则。虽然纳什证明了至少存在着一个均衡,但算出这个均衡是什么就是另外一回事了(而且通常有不止一个纳什均衡点存在,这使得事情变得非常复杂)。记住,每个人的“策略”都是精心地从数十数百数千(或者更多)的“特定”的纯策略中提取出来的混合策略。在大多数多人博弈中,计算所有选择组合的概率超出了英特尔、微软、IBM和苹果四大厂商计算能力的总和。
1701037151
1701037153
第六节 公共物品
1701037154
1701037155
尽管如此,这并非毫无希望。让我们来看另一个用来解释“背叛”的著名博弈——公共物品博弈。它描述的是团体里的一些成员没有尽到责任但却分得成员利益。就好像看公共电视却从不承诺任何的资金支持。乍看来,背叛者赢得了博弈——分文不花就可以收看侦探福尔摩斯和波洛的电视。但是,请想一下,如果每个人都背叛,将没有人能获益。搭便车的人将变成搭不到便车的倒霉者。
1701037156
1701037157
类似的,假设你的社区决定集资建一个公园。你喜欢这个提议,但是如果你认为会有足够的邻居捐了足够的钱来建它,你可能不会捐款。如果每个人都这样想,就不会有公园了。但假设背叛(拒绝捐款)和合作(捐出你的份额)并非仅有的可行策略。可能会有第三种策略,称之为双赢策略。如果你是一个互惠者,你只在确保一定数量的其他人捐款的情况下才会捐钱。计算机对这种博弈的模拟告诉我们,玩家采取这些策略的混合策略可能达到纳什均衡。
1701037158
[
上一页 ]
[ :1.701037109e+09 ]
[
下一页 ]