1704594350
1704594351
下面在博弈中加入情感因素。假设在游戏中,除了获得金钱回报之外,对你来说有价值的还包括,一方面要做一个正人君子,另一方面也不能“任人蒙骗”。如果你选择拿走,而另一名参与者选择分享,你会因为自己的贪得无厌感到惭愧。这种羞耻感存在负价值,我们姑且将其描述为相当于损失掉100美元。相反,如果你选择分享,而另一名参与者选择拿走,你会感到恼羞成怒。姑且可以说,这种情绪也相当于损失100美元。如果你们两人都选择拿走或都选择分享,你的情感反应则是不喜不悲。
1704594352
1704594353
现在假设另一名参与者在上述情况中也会产生完全相同的情感反应,且这些反应附带的金钱价值完全一致,对此博弈的分析则会出现显著变化。选择拿走,原本最高可得200美元现金,现在则变成了100美元,因为你可以说羞耻感会造成损失。新的价值低于选择分享的所得,意即你最理想的情况就是拿到150美元。因此,两名参与者同时选择分享成了新的均衡模式,即最有可能出现的情况是双方都选择合作,而非自私而为。
1704594354
1704594355
简而言之,这说明在这一等式中,情感——甚至包括愤怒和羞耻等消极情感——的存在可以提高两名参与者的最终所得。然而,这一解释并不完整。我想证明,上例中描述的情感并不是随机挑选的,而且实际上,这些情感切合有此情感之人最狭隘的物质利益。
1704594356
1704594357
假设有情感反应的参与者也能较为准确地预测到他人的情感反应。接下来,假设囚徒困境博弈中有一名参与者是个没有感情的人,凡事皆做最冷漠无情的思考,一心只谋求拿到最多的金钱收益,而另一名参与者有着前文所述的正常情感反应(及情感预测能力)。请试想一下,这种情况会造成什么样的结局。姑且将铁石心肠、精于算计的参与者称为“头脑先生”,而另一名参与者则为“情感先生”。
1704594358
1704594359
头脑先生自然会选择拿走,因为他不知羞耻。但情感先生很可能明白自己面对的是头脑先生,进而推断出头脑先生会选拿走。在此情况之下,如果情感先生选择分享,他会承受双重损失:一是他在博弈开始时拿到的100美元会被收回,二是他会觉得自己受到了羞辱,相当于再次损失了100美元,损失合计200美元。反之,如果他选择拿走,他只会损失50美元。情感先生因此认定,他也应该选拿走,这样他和头脑先生得到50美元,这与两名参与者都有感情的情况截然相反。上文已证明,这种情况可达到两人皆得150美元的均衡状态。结论是,情感行为有其益处:在这一简单的例子中,情感反应能在金钱方面构成正面优势。
1704594360
1704594361
该例来自我所建立的一个数学模型,该模型归纳了纳什均衡的概念。该模型表明,在许多类似囚徒困境的博弈中,合作的主要动机是追求互惠互利的情感需求。例如,在别人都慷慨相赠的情况下,自己因表现出贪欲而产生了羞耻感,或者别人贪得无厌时,自己会感到羞愤交加,这两种情感共同组成了道德金律,亦称互惠伦理。
1704594362
1704594363
道德金律在宗教典籍中受到了大肆的宣扬,所有小学生都要习得此道,以此种手段来保护他人的情感,即某些事虽然有悖于你的个人私欲,你却仍然要义不容辞,但这些实验表明,道德金律也是满足一己私利的重要手段。
1704594364
1704594365
[1]道德金律,即互惠伦理。这一术语的使用可追溯至17世纪的欧洲,指的是《马太福音》第七章第十二节和《路加福音》第六章第三十一节的论述,即“你们愿意人怎样待你,你们也要怎样待人”。这一金律几乎是世界通用的,因为许多国家的思想文化中都出现过类似的概念,如孔子的“己所不欲,勿施于人”。——译者注
1704594366
1704594367
[2]《美丽心灵》,约翰·纳什的传记片,改编自同名传记,由好莱坞演员拉塞尔·克劳主演,上映于2001年,并获得2002年奥斯卡最佳影片与最佳导演奖。——译者注
1704594368
1704594369
1704594370
1704594371
1704594373
狡猾的情感:为何愤怒、嫉妒、偏见让我们的决策更理性 第五章 重复互动中的囚徒困境
1704594374
1704594375
利刃出鞘是否能促进世界合作?
1704594376
1704594377
自发性、自动回应和反应迅速是情感反应最重要的特征。实际上,在很多情况下,反应敏捷正是情感反应优于深思熟虑之处。看到蛇在草丛中爬行就会本能地闪躲,这让我们免于潜在的危险,远比对形势做认知分析有效。
1704594378
1704594379
我们的社会性反应具有快速性和自动性的特点。事实证明,这两点至关重要。本章将说明情感行为如何在理性行为失效的情况下促成合作。吊诡的是,原因正在于其自动性。
1704594380
1704594381
我们将重新审视囚徒困境,但这次的重点是参与者在同一种博弈中多次对垒的情况。意即,参与者需要考虑长期的策略谋划。
1704594382
1704594383
前一章指出,在单次囚徒困境中,理性、自私的个体不会合作,因为不合作符合所谓的“优势策略”——无论另一名参与者作何选择,这一策略均可确保所得收益更高。接下来,请设想这种博弈连续进行两轮会出现什么情况。在这两轮博弈中,每名参与者每轮均须决定是合作(“分享”)还是不合作(“拿走”)。两轮博弈结束后,参与者所获得的收益总额即为两轮博弈的所得总和。
1704594384
1704594385
为了分析该重复博弈中的理性行为,我们首先着重分析一下第二轮博弈。在第二轮,原本的囚徒困境相当于只进行一轮——既然没有下一轮,这一轮的行为就不会受到惩罚或奖励。因此,其策略分析等同于单次囚徒困境的分析。对此,前文得出的结论是,唯一的理性行为就是两名参与者均不合作。
1704594386
1704594387
既然已经知道理性的参与者在第二轮中会作何选择,我们即可尝试预测参与者在第一轮博弈中会有何表现。参与者在第一轮的行为对第二轮博弈的所得毫无影响,因此第一轮实际上也相当于单次博弈。在第一轮,参与者也会双双选择不合作。
1704594388
1704594389
不难看出,只要两名参与者知道博弈究竟进行多少轮,同样的逻辑就适用于任意轮次的重复博弈,一轮、三轮还是十万轮均无差别。具体而言,若两名参与者知道双方进行的是最后一轮博弈,则无论此前的轮次是何状况,均不存在理性的原因会让他们选择合作。但也由此可见,在倒数第二轮中,他们也不会合作。以此类推。这种推理名为归纳论证,常用于博弈论分析。
1704594390
1704594391
须注意,这一论证的前提是,两名参与者在最后一轮选择不合作。但假如参与者不知道什么时候是最后一轮,即便真到了最后一轮也不知情,情况会如何?实际上,人类交往大多都是这种情况。例如,你同普通汽车修理工、公司同事乃至配偶之间的交往,你基本上从不知道未来还会与他们有多少次交集,这理所当然地引出了以下问题:假设参与者不知道重复博弈何时进行到最后一轮,对其理性行为应如何预测?
1704594392
1704594393
罗伯特·奥曼解答了这一至关重要的问题,这堪称他对博弈论做出的最重要贡献之一。奥曼利用数学模型,证明了在此种情形下,即便参与者是理性的,合作也可能达成均衡状态,这一模型及奥曼的验算有着奥妙之极的结构。原原本本地对其进行详细解释需对形式数学有较深的造诣,而这超出了本书的范围。因此,姑且让我尝试用较为浅显的语言予以解释。
1704594394
1704594395
试想你处于重复进行的囚徒困境中,每一轮过后,你都有99%的概率会再次和同一名对手重新进行同样的博弈,只有1%的概率再也不会见到此人。这一描述有些不切实际——很可能夸大了你在较长时期内与任何人产生交集的次数,但这却有助于描述多数互动的短视思维。因此,这一异议暂且搁置。
1704594396
1704594397
我们需要思考一下这种情况下的“策略”为何意。在单次博弈中,策略即指是否合作的决定。在重复博弈中,策略的概念则要复杂得多。实际上,这种策略指的是一长串决定,每次决定的内容就是根据此前轮次的博弈情况选择要采取的行动。以下是这种策略的一个例子:第700轮之前,无论对手怎么选,我都选择合作;从第700轮开始,一旦对手选择不合作,我就会在其后两轮也选不合作,以牙还牙。
1704594398
1704594399
如果你觉得这一策略看起来十分复杂,我的回答是,这实际上已经是非常简单的策略了——须注意,我在两句话之内便将其描述完毕。有些策略繁复之极,单是前几轮要写下来,整座国会图书馆的纸(包括卫生间的纸)都找来也不够用。然而,最复杂的策略往往也是最乏味的策略。实际上,本章要描述的两个策略简单明了,却很有意思:
[
上一页 ]
[ :1.70459435e+09 ]
[
下一页 ]