打字猴:1.70237853e+09

1702378530

1702378531 现在，她就坐在我面前，说她愿意做我的博士生，并以理论和计算为基础，为我们的进化博弈论体系增添一些与真实生活贴近的实验。几周之后，安娜发现，我们可以申请使用哈佛商学院的实验研究计算机实验室。实验室距离我们的办公室不远，里面满是现代化设备，四处是闪耀的屏幕和智能蓝牙装置。在这里，学生们可以用很少的资金投入，进行任何风格、规模和形式的博弈，从而对合作的世界进行进一步探索。

1702378532

1702378533 我们决定设计一个更加平衡的实验，来评估惩罚带来的影响。我们都感觉，以前的绝大多数实验，其设计初衷都有意夸大了惩罚的正面效果。现在我们想要进行的实验，不会刻意压制负面效果。当然，实验能否进行，还要看道德委员会是否批准。没想到，我们竟然不能在商学院进行任何与背叛有关的实验，如果想做，只能去心理学系。有幸的是，商学院允许我们在实验中增加与惩罚相关的元素。

1702378534

1702378535 全球金融危机之前，各地经常举办各类庆典活动。在诺瓦基亚的一次聚会上，我介绍安娜与大卫·兰德认识。他们谈得十分投机，决定共同工作。大卫有着非常与众不同的背景。他是在各类飞机旁边长大的。他的父亲是康奈尔大学应用数学系教授，非常热爱飞行，并且让儿子从很小的年纪就学习控制飞机操纵杆。要想成为一名优秀的飞行员，往往首先就需要拥有清晰的头脑，这也解释了大卫为什么拥有如此渊博的知识。他是哈佛大学第一位系统生物学毕业生，既是一名理论学家，也是一名实验主义者，如今经常与心理学家、经济学家和法学教授共同工作。他的才华远不止于学术领域，他还是位摇滚歌手，吉他玩得相当精妙，在YouTube上也能找到他的歌。

1702378536

1702378537 特殊的环境会造就特殊的行为，因此，大卫、安娜和我决定看一看，玩家之间的重复性相遇是否会对代价高昂的惩罚效果带来影响。我们与哈佛大学经济博弈论领域的著名专家朱·弗登伯格合作，请104名本科生参与了重复性两人囚徒困境的变体博弈。成对的两位玩家可以在合作、背叛和代价高昂的惩罚三者之间进行选择。“合作”意味着为了让对方得到3块钱，而支付1块钱。“背叛”意味着从对方处拿走1块钱。“惩罚”意味着为了让对方输掉4块钱，而支付1块钱。我们的实验设计与之前讲过的实验之间有很大的不同，最重要的是，我们允许玩家去满足自身报仇雪恨的欲望——如果艾丽斯惩罚了鲍勃，那么鲍勃就有机会在下一轮惩罚艾丽斯。

1702378538

1702378539 我们观察了成对玩家之间的1 230次重复性互动，每一次互动的时长在1轮～9轮之间不等。观察玩家的博弈实况是件很有意思的事情。这次实验的成果论文刊载在了《自然》杂志上。论文中的第二幅图表显示了代价高昂的惩罚所带来的影响。一对在4轮中保持合作的玩家，分数并列第一。那些忍受暴力、不愿反抗的玩家，成绩也很不错。在连续的两轮中，一位玩家虽然每次都遭到背叛，却始终坚持合作，之后继续维持宽容大度的心态，最终赢得了总分第六的成绩。而与他对弈的那位背叛者，在最后3轮中被感化成为合作者，最后的总分排名第19。还有一位合作者在背叛的行为面前忍无可忍，以惩罚的手段予以应对。5轮之后，背叛者还是没有在惩罚的压力面前采取合作。最终，他们分别获得了第25名和第22名。有一位合作者，在遇到背叛者的时候，以惩罚作为回应。这样就触发了背叛者的报复性惩罚，之后便是一轮接一轮的惩罚与反惩罚行为。这场相互打击博弈中的两位玩家，最终排名第30位和第25位。在一对玩家之间，我们还看到了先发制人实施打击的结果。在相互合作之后，一人实施惩罚，这激起了双方的背叛。惩罚者最后排名29，他的对手排名24。

1702378540

1702378541 研究过程中，一个现象引起了我们的注意，那就是惩罚与较差的成绩之间有着十分明显的联系。表现最佳的6个人一直都没有使用过惩罚手段。相比之下，成绩最差的玩家，也是使用惩罚手段最频繁的几个人。研究显示，分数最低的玩家，使用惩罚手段最频繁，因而激起了报复的恶性循环，对所有参与其中的人都造成了毁灭性的后果。也就是说，亨利惩罚萨丽的背叛行为，从而引发了萨丽采取反惩罚手段。亨利忍无可忍，决定进一步惩罚对方。于是，双方便踏上了相互惩罚的不归路。

1702378542

1702378543 也许，得到这样的结果纯属侥幸。也许我们的赢家不过是运气好，遇到了也愿意采取合作的对手。我们进行了更为深入的分析，对玩家以惩罚手段应对背叛的概率进行了测算。那些成绩较好的玩家，不会将斗争升级为报复性惩罚，而会停留在背叛的层面上，以背叛来应对背叛。其中传达出来的信息十分明确：惩罚者不是赢家。这样一来，当博弈将重复性考虑在内时，喜欢充分利用手中权限进行惩罚的玩家，其行为通常都没有好的实质效果。

1702378544

1702378545 奖励优于惩罚

1702378546

1702378547 着手进行这项研究时，关于成对玩家重复相遇并采取惩罚手段这其中的智慧，我们提出了一些思考。但我们研究的双人博弈并不属于公共品博弈的范畴。以前讲过，公共品博弈是玩家超过两人的囚徒困境。因此，我们的结论并不能简单地推及到之前其他学者进行的研究工作上，也无法用来评论费尔和盖其特的实验。费尔—盖其特实验的总结观点是，在维持公共品博弈的合作关系过程中，惩罚比奖励更加有效。于是，我们决定与在斯德哥尔摩经济学院工作的挪威人、瑞典著名经济学家托尔·埃林森（Tore Ellingsen）共同协作，展开一场我们自己的公共品博弈。

1702378548

1702378549 这场实验共有192人参加。实验对象4人一组，分别有16个控制组和32个实验组。实际上，我们大致遵从了费尔—盖其特最初的博弈设置，但在其中加入了另一项元素。我们允许了玩家之间的重复相遇，而非匿名相遇。这样一来，就可以知道是谁在惩罚谁。

1702378550

1702378551 我们进行了3场“诊疗”实验和一场控制实验。控制实验就是标准的公共品博弈。一号诊疗实验中加入了惩罚机制，二号诊疗实验中加入了奖励机制，三号诊疗实验中加入了惩罚与奖励机制。成本如下：“惩罚”意味着为了给他人造成损失，你要付出；“奖励”意味着为了让他人有所收获，你要付出。每组进行长达50轮的博弈。

1702378552

1702378553 实验过程中，3支诊疗组均出现了合作，而控制组则陷入了典型的“公地悲剧”之中。然而，虽然惩罚可以引发合作，但其成本却十分高昂，而最终的总分也与控制组一样低。相比之下，奖励诊疗组在公共品博弈过程中也保持了很高的贡献数额，总分也比控制组高出许多。我们发现，在同时给出惩罚和奖励两种选择的情况下，获胜的小组并不会使用成本高昂而无效的惩罚机制。从有益于公共事业并促进合作的角度讲，奖励比惩罚更加有效，虽然搭便车的行为屡屡从中造成破坏，但也无法影响这样的结论。

1702378554

1702378555 从这场实验之中，我们总结出了一个简单的心得：通过将公共品博弈与定向互动博弈联系在一起，就能解决公地悲剧。也就是说，与其停止合作并影响到传统公共品博弈中的所有玩家，不如只停止与那些背叛者的合作，甚至还可以对其他的合作者予以奖励。公共品博弈中的合作者能赢得好名声，使得其他的合作者更愿意与他们进行私下一对一的交易，就像那些有绿色环保名声的公司更容易获得商业机会一样。这一引导合作的策略十分简单有效。我们于2009年将研究成果发表于《科学》杂志时，文章的题目就是《积极互动促进公共合作》（Positive Interactions Promote Public Cooperation）。

1702378556

1702378557 超级合作者 [:1702376346]

1702378558 惩罚的负面作用

1702378559

1702378560 贝内迪克特·赫尔曼（BenediktHerrmann）、克里斯蒂安·托尼（Christian Thöni）和西蒙·盖其特共同进行了一项实验，进一步质疑了代价高昂的惩罚在促进合作的过程中所发挥的效用。他们研究了全球16座城市中人们的行为，其中包括波士顿、波恩、利雅得、明斯克、诺丁汉、首尔等。这次实验是当时在发达国家展开的规模最大的跨文化实验研究项目。

1702378561

1702378562 和之前的博弈一样，参与者进行了一场公共品博弈。玩家握有筹码，或者全部保留，或者将筹码放入“公共集资箱”中，获得的额外利息将在所有玩家中平分。10轮博弈之后，1120名来自波士顿和哥本哈根中产阶级家庭的大学生，平均每人贡献了8个筹码，而来自雅典、利雅得和伊斯坦布尔的学生，平均仅贡献了6个筹码。最具合作精神的参与者拿出了90%的筹码，而最缺乏合作精神的参与者，平均只拿出了29%的筹码。合作者的贡献量，是欠合作者贡献量的3.1倍。

1702378563

1702378564 当给予玩家惩罚的能力，可以对按住筹码不放的玩家实施惩罚之时，参与者的行为发生了巨大的变化。就像之前的研究工作显示的一样，玩家愿意拿出自己的一部分筹码，来惩罚吝啬的投资者或盘剥他人的搭便车者。但在这场博弈的国际版本中，国家与国家之间出现了巨大的差异。

1702378565

1702378566 在美国、瑞士和英国等国，当搭便车者因为将自身利益置于集体利益之上而受到惩罚时，会心平气和地接受惩罚，然后变得更具合作精神，博弈的总收益也随着时间的发展越来越多。但是，在希腊和俄罗斯等国，搭便车者会采取报复行为。由于这场博弈沿用了费尔—盖其特实验的设计，因此玩家无法进行定向报复。于是，他们就将仇恨通通抛向合作者。也许，他们认为这样做可以在下一轮惩罚行动中先发制人，或者认为这些合作者是先前一轮中最有可能惩罚过他们的人。也许，搭便车者惩罚合作者是为了显示自身的支配地位，表达出某些信息，比如“这些合作者不把所有的筹码按在手中，简直就是愚蠢和软弱的表现，我要通过惩罚来让他们知道，谁才是老大”。

1702378567

1702378568 研究结果似乎肯定了人们心中对各国人民的一些看法。英国人一直怀有公平意识，而希腊人则渴望报复的机会。雅典和马斯喀特的玩家的报复性惩罚水平最高，他们对合作者采取的惩罚行为是来自首尔、波恩、诺丁汉和其他城市玩家的6倍之多。萨马拉、明斯克、伊斯坦布尔和利雅得的情况则居于两者之间。

1702378569

1702378570 我们有一个十分有趣的发现，那就是对报复和主宰的渴望，与社会科学家在世界民主调查（World Democracy Audit）中总结出来的市民合作规范与法律规则相吻合。这些规范包含人们对法律的普遍态度，并在政治权利、公民自由、言论自由和腐败之间进行了权衡。其中对法律的态度是指，市民是否认为避税或无视法规是可以接受的行为。在拥有根深蒂固的公共合作氛围的社会之中，人们对警察及执法机构充满信任，因此通常不会出现报复行为。但在那些法律规则被认为不够有效的社会中——犯罪分子常常逍遥法外，就会出现反社会的“报复性”惩罚行为，出现背叛者惩罚合作者的现象。在这样的环境之中，合作行为受到了极大的抑制，人们都有搭便车的动机，忽视诸如垃圾回收、邻里督查、投票选举、保护当地环境、应对气候变化等市民本应牢记在心的举动。

1702378571

1702378572 研究工作还揭示出了另一项重要发现：在国际博弈中，惩罚行为并不总能激发出下一轮博弈的合作行为。在所有参与者进行的博弈中，半数的合作行为会继续保持初始水平，而且，反社会惩罚的水平越高，合作行为的增加量就越少。由此看来，“利他惩罚”并不能很好地帮助人们达成合作关系。这样的结论，似乎让我从中体会到了一点真实生活的味道。

1702378573

1702378574 惩罚的目的

1702378575

1702378576 我们先退后一步，将惩罚研究放在一个更为宽泛的环境中来看。惩罚，有两种基本分类。本章中的讨论主要针对其中一种：同侪惩罚，也就是黑手党惯用的手法，或是自行惩戒犯错之人的手段。第二类惩罚来自于更高层级的权威，一般存在于层级体制之中。举例来说，国家可以惩罚触犯法律的人，其手段各异，有绞刑、囚禁或注射处死；家长可以因为孩子的学习问题而进行责罚；老板可以惩罚下属；亦可以将惩罚视作维持层级体制的手段，这样上尉就能让手下的小兵乖乖听话，等等。这就是“制度化惩罚”。我对这种类型的惩罚也颇感兴趣，而且不可否认，这种类型也十分重要。然而，研究人员却很少就这类惩罚进行博弈论研究。

1702378577

1702378578 目前，绝大多数研究人员都将重点放在了同侪惩罚上。我们要将这个问题放在公地悲剧和囚徒困境的大背景下来看。在两人之间构成的囚徒困境中，通过将策略从合作转向背叛，我可以对背叛者进行惩罚。但如果在公地悲剧这样有许多人参与游戏的情况下转向背叛，我就既伤害了合作者，又伤害了背叛者——我会因为自己的背叛行为伤害到每一个参与游戏的人。而问题也恰恰存在于此。

1702378579

[ 上一页 ] [ :1.70237853e+09 ] [ 下一页 ]