打字猴:1.70459436e+09
1704594360
1704594361 该例来自我所建立的一个数学模型,该模型归纳了纳什均衡的概念。该模型表明,在许多类似囚徒困境的博弈中,合作的主要动机是追求互惠互利的情感需求。例如,在别人都慷慨相赠的情况下,自己因表现出贪欲而产生了羞耻感,或者别人贪得无厌时,自己会感到羞愤交加,这两种情感共同组成了道德金律,亦称互惠伦理。
1704594362
1704594363 道德金律在宗教典籍中受到了大肆的宣扬,所有小学生都要习得此道,以此种手段来保护他人的情感,即某些事虽然有悖于你的个人私欲,你却仍然要义不容辞,但这些实验表明,道德金律也是满足一己私利的重要手段。
1704594364
1704594365 [1]道德金律,即互惠伦理。这一术语的使用可追溯至17世纪的欧洲,指的是《马太福音》第七章第十二节和《路加福音》第六章第三十一节的论述,即“你们愿意人怎样待你,你们也要怎样待人”。这一金律几乎是世界通用的,因为许多国家的思想文化中都出现过类似的概念,如孔子的“己所不欲,勿施于人”。——译者注
1704594366
1704594367 [2]《美丽心灵》,约翰·纳什的传记片,改编自同名传记,由好莱坞演员拉塞尔·克劳主演,上映于2001年,并获得2002年奥斯卡最佳影片与最佳导演奖。——译者注
1704594368
1704594369
1704594370
1704594371
1704594372 狡猾的情感:为何愤怒、嫉妒、偏见让我们的决策更理性 [:1704593832]
1704594373 狡猾的情感:为何愤怒、嫉妒、偏见让我们的决策更理性 第五章 重复互动中的囚徒困境
1704594374
1704594375 利刃出鞘是否能促进世界合作?
1704594376
1704594377 自发性、自动回应和反应迅速是情感反应最重要的特征。实际上,在很多情况下,反应敏捷正是情感反应优于深思熟虑之处。看到蛇在草丛中爬行就会本能地闪躲,这让我们免于潜在的危险,远比对形势做认知分析有效。
1704594378
1704594379 我们的社会性反应具有快速性和自动性的特点。事实证明,这两点至关重要。本章将说明情感行为如何在理性行为失效的情况下促成合作。吊诡的是,原因正在于其自动性。
1704594380
1704594381 我们将重新审视囚徒困境,但这次的重点是参与者在同一种博弈中多次对垒的情况。意即,参与者需要考虑长期的策略谋划。
1704594382
1704594383 前一章指出,在单次囚徒困境中,理性、自私的个体不会合作,因为不合作符合所谓的“优势策略”——无论另一名参与者作何选择,这一策略均可确保所得收益更高。接下来,请设想这种博弈连续进行两轮会出现什么情况。在这两轮博弈中,每名参与者每轮均须决定是合作(“分享”)还是不合作(“拿走”)。两轮博弈结束后,参与者所获得的收益总额即为两轮博弈的所得总和。
1704594384
1704594385 为了分析该重复博弈中的理性行为,我们首先着重分析一下第二轮博弈。在第二轮,原本的囚徒困境相当于只进行一轮——既然没有下一轮,这一轮的行为就不会受到惩罚或奖励。因此,其策略分析等同于单次囚徒困境的分析。对此,前文得出的结论是,唯一的理性行为就是两名参与者均不合作。
1704594386
1704594387 既然已经知道理性的参与者在第二轮中会作何选择,我们即可尝试预测参与者在第一轮博弈中会有何表现。参与者在第一轮的行为对第二轮博弈的所得毫无影响,因此第一轮实际上也相当于单次博弈。在第一轮,参与者也会双双选择不合作。
1704594388
1704594389 不难看出,只要两名参与者知道博弈究竟进行多少轮,同样的逻辑就适用于任意轮次的重复博弈,一轮、三轮还是十万轮均无差别。具体而言,若两名参与者知道双方进行的是最后一轮博弈,则无论此前的轮次是何状况,均不存在理性的原因会让他们选择合作。但也由此可见,在倒数第二轮中,他们也不会合作。以此类推。这种推理名为归纳论证,常用于博弈论分析。
1704594390
1704594391 须注意,这一论证的前提是,两名参与者在最后一轮选择不合作。但假如参与者不知道什么时候是最后一轮,即便真到了最后一轮也不知情,情况会如何?实际上,人类交往大多都是这种情况。例如,你同普通汽车修理工、公司同事乃至配偶之间的交往,你基本上从不知道未来还会与他们有多少次交集,这理所当然地引出了以下问题:假设参与者不知道重复博弈何时进行到最后一轮,对其理性行为应如何预测?
1704594392
1704594393 罗伯特·奥曼解答了这一至关重要的问题,这堪称他对博弈论做出的最重要贡献之一。奥曼利用数学模型,证明了在此种情形下,即便参与者是理性的,合作也可能达成均衡状态,这一模型及奥曼的验算有着奥妙之极的结构。原原本本地对其进行详细解释需对形式数学有较深的造诣,而这超出了本书的范围。因此,姑且让我尝试用较为浅显的语言予以解释。
1704594394
1704594395 试想你处于重复进行的囚徒困境中,每一轮过后,你都有99%的概率会再次和同一名对手重新进行同样的博弈,只有1%的概率再也不会见到此人。这一描述有些不切实际——很可能夸大了你在较长时期内与任何人产生交集的次数,但这却有助于描述多数互动的短视思维。因此,这一异议暂且搁置。
1704594396
1704594397 我们需要思考一下这种情况下的“策略”为何意。在单次博弈中,策略即指是否合作的决定。在重复博弈中,策略的概念则要复杂得多。实际上,这种策略指的是一长串决定,每次决定的内容就是根据此前轮次的博弈情况选择要采取的行动。以下是这种策略的一个例子:第700轮之前,无论对手怎么选,我都选择合作;从第700轮开始,一旦对手选择不合作,我就会在其后两轮也选不合作,以牙还牙。
1704594398
1704594399 如果你觉得这一策略看起来十分复杂,我的回答是,这实际上已经是非常简单的策略了——须注意,我在两句话之内便将其描述完毕。有些策略繁复之极,单是前几轮要写下来,整座国会图书馆的纸(包括卫生间的纸)都找来也不够用。然而,最复杂的策略往往也是最乏味的策略。实际上,本章要描述的两个策略简单明了,却很有意思:
1704594400
1704594401 冷酷触发策略。在第一轮,我会选择“分享”,且只要对方也选“分享”,我会一直这样选下去。然而,如果对方在某一轮选了“拿走”(即便对方只选过这一次拿走),这之后的每一轮,我都会一直选“拿走”。
1704594402
1704594403 针锋相对策略。每一轮,我的选择都和对手上一轮的选择相同。
1704594404
1704594405 两名理性参与者(唯一的目的就是谋求个人的物质利益)如均使用冷酷触发策略,会一直处于双方均选合作(即均选“分享”)的均衡态势。对此的解释相当简单,首先请注意,两名参与者都使用冷酷触发策略的话,他们在第一轮就会选合作。二者知道对方选了合作后,在这一策略的指导下,第二轮会再次双双选择合作,同理第三轮也会选合作,以此类推。每一轮,双方选择合作,每人的总奖金都会增加50%。
1704594406
1704594407 只要对方坚持使用冷酷触发策略,两人选择其他任何策略都无法增加所得。诚然,如果一名参与者在某一轮选择“拿走”,而另一名参与者仍然使用冷酷触发策略,则选择“拿走”的参与者本轮可得100美元,比他选择“分享”的所得多50美元。但这样一来,他会触发对方的“惩罚措施”:在其后每一轮中(此后还有许多轮),对方无论如何都会坚定不移地选“拿走”,他每轮都会少拿50美元,而不是多拿50美元。须注意,这种情况下稳定的合作态势之所以能够形成,是因为不合作行为一旦出现,即会立即招来对方的报复,让对方也选择不合作,从而对不合作行为形成有效的震慑。
1704594408
1704594409 * * *
[ 上一页 ]  [ :1.70459436e+09 ]  [ 下一页 ]