打字猴:1.70459436e+09

1704594360

1704594361 该例来自我所建立的一个数学模型，该模型归纳了纳什均衡的概念。该模型表明，在许多类似囚徒困境的博弈中，合作的主要动机是追求互惠互利的情感需求。例如，在别人都慷慨相赠的情况下，自己因表现出贪欲而产生了羞耻感，或者别人贪得无厌时，自己会感到羞愤交加，这两种情感共同组成了道德金律，亦称互惠伦理。

1704594362

1704594363 道德金律在宗教典籍中受到了大肆的宣扬，所有小学生都要习得此道，以此种手段来保护他人的情感，即某些事虽然有悖于你的个人私欲，你却仍然要义不容辞，但这些实验表明，道德金律也是满足一己私利的重要手段。

1704594364

1704594365 [1]道德金律，即互惠伦理。这一术语的使用可追溯至17世纪的欧洲，指的是《马太福音》第七章第十二节和《路加福音》第六章第三十一节的论述，即“你们愿意人怎样待你，你们也要怎样待人”。这一金律几乎是世界通用的，因为许多国家的思想文化中都出现过类似的概念，如孔子的“己所不欲，勿施于人”。——译者注

1704594366

1704594367 [2]《美丽心灵》，约翰·纳什的传记片，改编自同名传记，由好莱坞演员拉塞尔·克劳主演，上映于2001年，并获得2002年奥斯卡最佳影片与最佳导演奖。——译者注

1704594368

1704594369

1704594370

1704594371

1704594372 狡猾的情感：为何愤怒、嫉妒、偏见让我们的决策更理性 [:1704593832]

1704594373 狡猾的情感：为何愤怒、嫉妒、偏见让我们的决策更理性第五章重复互动中的囚徒困境

1704594374

1704594375 利刃出鞘是否能促进世界合作？

1704594376

1704594377 自发性、自动回应和反应迅速是情感反应最重要的特征。实际上，在很多情况下，反应敏捷正是情感反应优于深思熟虑之处。看到蛇在草丛中爬行就会本能地闪躲，这让我们免于潜在的危险，远比对形势做认知分析有效。

1704594378

1704594379 我们的社会性反应具有快速性和自动性的特点。事实证明，这两点至关重要。本章将说明情感行为如何在理性行为失效的情况下促成合作。吊诡的是，原因正在于其自动性。

1704594380

1704594381 我们将重新审视囚徒困境，但这次的重点是参与者在同一种博弈中多次对垒的情况。意即，参与者需要考虑长期的策略谋划。

1704594382

1704594383 前一章指出，在单次囚徒困境中，理性、自私的个体不会合作，因为不合作符合所谓的“优势策略”——无论另一名参与者作何选择，这一策略均可确保所得收益更高。接下来，请设想这种博弈连续进行两轮会出现什么情况。在这两轮博弈中，每名参与者每轮均须决定是合作（“分享”）还是不合作（“拿走”）。两轮博弈结束后，参与者所获得的收益总额即为两轮博弈的所得总和。

1704594384

1704594385 为了分析该重复博弈中的理性行为，我们首先着重分析一下第二轮博弈。在第二轮，原本的囚徒困境相当于只进行一轮——既然没有下一轮，这一轮的行为就不会受到惩罚或奖励。因此，其策略分析等同于单次囚徒困境的分析。对此，前文得出的结论是，唯一的理性行为就是两名参与者均不合作。

1704594386

1704594387 既然已经知道理性的参与者在第二轮中会作何选择，我们即可尝试预测参与者在第一轮博弈中会有何表现。参与者在第一轮的行为对第二轮博弈的所得毫无影响，因此第一轮实际上也相当于单次博弈。在第一轮，参与者也会双双选择不合作。

1704594388

1704594389 不难看出，只要两名参与者知道博弈究竟进行多少轮，同样的逻辑就适用于任意轮次的重复博弈，一轮、三轮还是十万轮均无差别。具体而言，若两名参与者知道双方进行的是最后一轮博弈，则无论此前的轮次是何状况，均不存在理性的原因会让他们选择合作。但也由此可见，在倒数第二轮中，他们也不会合作。以此类推。这种推理名为归纳论证，常用于博弈论分析。

1704594390

1704594391 须注意，这一论证的前提是，两名参与者在最后一轮选择不合作。但假如参与者不知道什么时候是最后一轮，即便真到了最后一轮也不知情，情况会如何？实际上，人类交往大多都是这种情况。例如，你同普通汽车修理工、公司同事乃至配偶之间的交往，你基本上从不知道未来还会与他们有多少次交集，这理所当然地引出了以下问题：假设参与者不知道重复博弈何时进行到最后一轮，对其理性行为应如何预测？

1704594392

1704594393 罗伯特·奥曼解答了这一至关重要的问题，这堪称他对博弈论做出的最重要贡献之一。奥曼利用数学模型，证明了在此种情形下，即便参与者是理性的，合作也可能达成均衡状态，这一模型及奥曼的验算有着奥妙之极的结构。原原本本地对其进行详细解释需对形式数学有较深的造诣，而这超出了本书的范围。因此，姑且让我尝试用较为浅显的语言予以解释。

1704594394

1704594395 试想你处于重复进行的囚徒困境中，每一轮过后，你都有99%的概率会再次和同一名对手重新进行同样的博弈，只有1%的概率再也不会见到此人。这一描述有些不切实际——很可能夸大了你在较长时期内与任何人产生交集的次数，但这却有助于描述多数互动的短视思维。因此，这一异议暂且搁置。

1704594396

1704594397 我们需要思考一下这种情况下的“策略”为何意。在单次博弈中，策略即指是否合作的决定。在重复博弈中，策略的概念则要复杂得多。实际上，这种策略指的是一长串决定，每次决定的内容就是根据此前轮次的博弈情况选择要采取的行动。以下是这种策略的一个例子：第700轮之前，无论对手怎么选，我都选择合作；从第700轮开始，一旦对手选择不合作，我就会在其后两轮也选不合作，以牙还牙。

1704594398

1704594399 如果你觉得这一策略看起来十分复杂，我的回答是，这实际上已经是非常简单的策略了——须注意，我在两句话之内便将其描述完毕。有些策略繁复之极，单是前几轮要写下来，整座国会图书馆的纸（包括卫生间的纸）都找来也不够用。然而，最复杂的策略往往也是最乏味的策略。实际上，本章要描述的两个策略简单明了，却很有意思：

1704594400

1704594401 冷酷触发策略。在第一轮，我会选择“分享”，且只要对方也选“分享”，我会一直这样选下去。然而，如果对方在某一轮选了“拿走”（即便对方只选过这一次拿走），这之后的每一轮，我都会一直选“拿走”。

1704594402

1704594403 针锋相对策略。每一轮，我的选择都和对手上一轮的选择相同。

1704594404

1704594405 两名理性参与者（唯一的目的就是谋求个人的物质利益）如均使用冷酷触发策略，会一直处于双方均选合作（即均选“分享”）的均衡态势。对此的解释相当简单，首先请注意，两名参与者都使用冷酷触发策略的话，他们在第一轮就会选合作。二者知道对方选了合作后，在这一策略的指导下，第二轮会再次双双选择合作，同理第三轮也会选合作，以此类推。每一轮，双方选择合作，每人的总奖金都会增加50%。

1704594406

1704594407 只要对方坚持使用冷酷触发策略，两人选择其他任何策略都无法增加所得。诚然，如果一名参与者在某一轮选择“拿走”，而另一名参与者仍然使用冷酷触发策略，则选择“拿走”的参与者本轮可得100美元，比他选择“分享”的所得多50美元。但这样一来，他会触发对方的“惩罚措施”：在其后每一轮中（此后还有许多轮），对方无论如何都会坚定不移地选“拿走”，他每轮都会少拿50美元，而不是多拿50美元。须注意，这种情况下稳定的合作态势之所以能够形成，是因为不合作行为一旦出现，即会立即招来对方的报复，让对方也选择不合作，从而对不合作行为形成有效的震慑。

1704594408

1704594409 *　*　*

[ 上一页 ] [ :1.70459436e+09 ] [ 下一页 ]