打字猴:1.702378495e+09

1702378495 超级合作者 [:1702376344]

1702378496 为了集体利益的有代价惩罚

1702378497

1702378498 两位奥地利经济学家，瑞士苏黎世大学（University of Zürich）的厄恩斯特·费尔（ErnstFehr）和当时在瑞士圣加仑大学（University of St. Gallen），现就职于英国诺丁汉大学的西蒙·盖其特（Simon Gächter）一起，通过一场实验，揭示出这样一个思想：代价高昂的惩罚可能是促进合作的强大动力。

1702378499

1702378500 费尔和盖其特邀请240名本科生参与了实验。首先，他们进行了之前讨论过的那一类公共品博弈。之后给玩家一个选择，可以进行惩罚。实验将每一位玩家在博弈过程中作出的贡献公之于众，并询问玩家是否愿意付出成本来让另一位吝啬的玩家损失更多。玩家的身份在每一轮之后都要经过重新洗牌。这样一来，博弈进行过程中，就无法得知究竟是谁在与谁对决，因此博弈并不具有真正的重复性，玩家也无法建立起名声。而且，你永远也不会发现究竟是谁对你进行了惩罚。由此也就完全无法进行报复。

1702378501

1702378502 总的来看，实验共分10组，每组24个被试。每个被试进行“两次”六轮公共品博弈：一次没有惩罚的机会，另一次则带有惩罚的机会。在没有惩罚机会的情况下，玩家开始时都非常慷慨，但很快便学会了吝啬。他们发现，只能通过减少自身贡献的方法来惩罚搭便车者。这样，合作很快便解体了。

1702378503

1702378504 在拥有惩罚机会的情况下发生了什么呢？实验中的240位被试中，有84%的人至少采取了一次惩罚措施，还有大约9%的人惩罚了超过10次以上。大多数（74%）惩罚行为，都是合作者（也就是作出贡献在平均水平以上的人）主动针对背叛者（作出贡献在平均水平以下的人）而施加的。在惩罚的帮助下，玩家之间的合作关系维持在良好的状态之中。当可以采取惩罚手段时，有超过90%的参与者都贡献出了更多的钱。而这种类型的惩罚，罚款是要上缴给实验管理人员的，并不会还到惩罚者手中，因此，施加惩罚的代价十分高昂。但尽管如此，费尔和盖其特认为，人们参与到这种惩罚行为之中的倾向是普遍存在的。甚至到了博弈的最后一轮，惩罚依旧存在，虽然此时进行的惩罚对未来的合作已经无所助益。

1702378505

1702378506 基于上述实验结果，研究人员提出，人是“喜欢惩罚”的，而代价高昂的惩罚是促进合作的一种新型机制。研究人员还提出了“利他惩罚”这个说法，用来说明，就算我们自身无法从惩罚行为中获益，我们还是会有惩罚的冲动。利他惩罚显示出，我们愿意为了集体和社会的利益而惩罚他人。

1702378507

1702378508 我对费尔和盖其特的实验产生了很大的兴趣，也认为这一实验有着很高的重要性，但我对他们的某些理解角度不敢苟同。首先，代价高昂的惩罚并不是合作进化中的一个独立机制。如果我因为之前遭遇到你的背叛行为而实施惩罚，那么就属于直接互惠范畴。如果我因为你背叛其他玩家的行为而惩罚你，那么就属于间接互惠范畴。其次，现实生活中采取代价高昂的惩罚措施的人，他们的动机根本与“利他”精神搭不上边。对他人进行伤害，意味着冲突的升级。这样的惩罚是受到了愤怒、贪婪和进攻性的驱使。其首要目的，是为了打压他人、盘剥他人、削弱他人、消灭他人。“代价高昂的惩罚”这一说法，显示出惩罚者本身也要付出代价，因此，似乎比“利他惩罚”的说法更为恰当。

1702378509

1702378510 对这些实验结果仔细观察，就会发现，惩罚组的平均回报低于控制组得到的回报。在公共品博弈中，惩罚的手段的确可以强迫玩家进行合作，但其成本过高，将合作带来的优势也破坏掉了。换句话说，如果根本不给玩家以惩罚的机会，反而可能会得到更好的结果。

1702378511

1702378512 这场博弈中也带有一些人工雕琢的痕迹。一轮公共品博弈紧跟着一轮惩罚博弈。公共品博弈中，玩家被告知谁贡献了多少，但在惩罚博弈中，却无法得知是谁惩罚了自己。这样，惩罚就以匿名的方式进行，根本不用担心有人报复。实验的设计初衷，就是要让惩罚行为以最有效的方式进行。而现实生活则非常不同。当我们对他人进行惩罚的时候，人们通常知道是谁在惩罚他们，我们也要时刻准备好应对他人的报复行为。

1702378513

1702378514 在进化发展的历史过程中，我们的祖先什么时候遇到过费尔—盖其特实验中这样独特的情况：我们知道谁在公共品博弈中作出了贡献，却不知道接下来的一轮中，是谁惩罚了我们？

1702378515

1702378516 加州大学圣塔芭芭拉分校的进化心理学家约翰·托比（JohnTooby）指出，在人类思想进化的绝大部分时期里，人类都生活在小范围的群体之中，彼此之间经常相遇。古代社会中，人们很可能知道，怀有敌意的部落成员之间互相做了些什么。在小群体中生存，谁也不知道哪天就会需要某人的帮忙。因此，为了和部落成员搞好关系，就存在合作的压力。甚至在匿名的现代社会之中，虽然存在着一次相遇、终生不见的可能性，譬如在公路上或城市中，但我们还是会想一想，这位撞上我们的陌生人，或那位差点儿把我们弄伤的骑行者，很可能会再次出现在我们的生活中，出现在工作交流、朋友聚会等场合中。

1702378517

1702378518 试图排除重复和名声因素的所谓“一次性”实验，有些令人难以理解。原因在于，这样的实验与实际情况相差太远。我们所有的本能、直觉和行为，在世世代代的传承中逐渐成形，而且就是在人与人之间不断相遇、名声会发生作用的环境中定型的。因此，从一次性实验中对人类行为的普遍真理进行推论，是十分危险的举动。罗伯特·特里弗斯（RobertTrivers）在讨论费尔—盖其特实验时曾评论道，生物学家在实验室中饲养蜘蛛，是为了研究其生活习性，但这并不意味着，生物学家认为蜘蛛是在实验室环境中完成进化的。

1702378519

1702378520 如果现实生活中的惩罚，经常发生在人们知道是谁惩罚了谁这样不断重复的活动之中，那么就很难真正利用匿名惩罚实验中得出的结论。如果我们想要了解人类行为，以及合作与惩罚之间的相互关系，我们就需要对玩家会经常相遇的情形加以研究。脱离直接互惠与间接互惠的稳固框架去研究人类行为，意义不大。日常生活中所有重要的互动，都是在“重复”和“名声”存在的条件下发生的。

1702378521

1702378522 超级合作者 [:1702376345]

1702378523 真正的赢家无须惩罚

1702378524

1702378525 在这样一个黄金时代，没有威压，没有法律，善良与真实以最自然的状态勃发出来。不存在恐惧或惩罚，青铜碑文中看不到威胁的语句。人们也不惧怕法官的表情，因为他们可以在没有保护的环境中安全地生活。

1702378526

1702378527 罗马诗人奥维德，《变形记》

1702378528

1702378529 在哈佛的一天，一位来自瑞典的硕士生登门拜访了我。她对参加实验室的研究工作抱有非常大的热情。她名叫安娜·德莱博（AnnaDreber），在斯德哥尔摩市政厅长大。她的母亲是一位严苛的女权主义者、政治家兼道德活动家，曾担任副市长一职。安娜就是在市政府里面长大成人的。市政府大楼始建于20世纪20年代，带有典型的文艺复兴时期的宫殿风格。大楼围绕着两处露天广场——花园（Borgargarden）和蓝厅（Blue Hall）建成。每逢12月，当瑞典漆黑的夜空被闪耀的水晶灯点亮时，安娜都能亲身体会到诺贝尔晚宴时的炫目与繁华。

1702378530

1702378531 现在，她就坐在我面前，说她愿意做我的博士生，并以理论和计算为基础，为我们的进化博弈论体系增添一些与真实生活贴近的实验。几周之后，安娜发现，我们可以申请使用哈佛商学院的实验研究计算机实验室。实验室距离我们的办公室不远，里面满是现代化设备，四处是闪耀的屏幕和智能蓝牙装置。在这里，学生们可以用很少的资金投入，进行任何风格、规模和形式的博弈，从而对合作的世界进行进一步探索。

1702378532

1702378533 我们决定设计一个更加平衡的实验，来评估惩罚带来的影响。我们都感觉，以前的绝大多数实验，其设计初衷都有意夸大了惩罚的正面效果。现在我们想要进行的实验，不会刻意压制负面效果。当然，实验能否进行，还要看道德委员会是否批准。没想到，我们竟然不能在商学院进行任何与背叛有关的实验，如果想做，只能去心理学系。有幸的是，商学院允许我们在实验中增加与惩罚相关的元素。

1702378534

1702378535 全球金融危机之前，各地经常举办各类庆典活动。在诺瓦基亚的一次聚会上，我介绍安娜与大卫·兰德认识。他们谈得十分投机，决定共同工作。大卫有着非常与众不同的背景。他是在各类飞机旁边长大的。他的父亲是康奈尔大学应用数学系教授，非常热爱飞行，并且让儿子从很小的年纪就学习控制飞机操纵杆。要想成为一名优秀的飞行员，往往首先就需要拥有清晰的头脑，这也解释了大卫为什么拥有如此渊博的知识。他是哈佛大学第一位系统生物学毕业生，既是一名理论学家，也是一名实验主义者，如今经常与心理学家、经济学家和法学教授共同工作。他的才华远不止于学术领域，他还是位摇滚歌手，吉他玩得相当精妙，在YouTube上也能找到他的歌。

1702378536

1702378537 特殊的环境会造就特殊的行为，因此，大卫、安娜和我决定看一看，玩家之间的重复性相遇是否会对代价高昂的惩罚效果带来影响。我们与哈佛大学经济博弈论领域的著名专家朱·弗登伯格合作，请104名本科生参与了重复性两人囚徒困境的变体博弈。成对的两位玩家可以在合作、背叛和代价高昂的惩罚三者之间进行选择。“合作”意味着为了让对方得到3块钱，而支付1块钱。“背叛”意味着从对方处拿走1块钱。“惩罚”意味着为了让对方输掉4块钱，而支付1块钱。我们的实验设计与之前讲过的实验之间有很大的不同，最重要的是，我们允许玩家去满足自身报仇雪恨的欲望——如果艾丽斯惩罚了鲍勃，那么鲍勃就有机会在下一轮惩罚艾丽斯。

1702378538

1702378539 我们观察了成对玩家之间的1 230次重复性互动，每一次互动的时长在1轮～9轮之间不等。观察玩家的博弈实况是件很有意思的事情。这次实验的成果论文刊载在了《自然》杂志上。论文中的第二幅图表显示了代价高昂的惩罚所带来的影响。一对在4轮中保持合作的玩家，分数并列第一。那些忍受暴力、不愿反抗的玩家，成绩也很不错。在连续的两轮中，一位玩家虽然每次都遭到背叛，却始终坚持合作，之后继续维持宽容大度的心态，最终赢得了总分第六的成绩。而与他对弈的那位背叛者，在最后3轮中被感化成为合作者，最后的总分排名第19。还有一位合作者在背叛的行为面前忍无可忍，以惩罚的手段予以应对。5轮之后，背叛者还是没有在惩罚的压力面前采取合作。最终，他们分别获得了第25名和第22名。有一位合作者，在遇到背叛者的时候，以惩罚作为回应。这样就触发了背叛者的报复性惩罚，之后便是一轮接一轮的惩罚与反惩罚行为。这场相互打击博弈中的两位玩家，最终排名第30位和第25位。在一对玩家之间，我们还看到了先发制人实施打击的结果。在相互合作之后，一人实施惩罚，这激起了双方的背叛。惩罚者最后排名29，他的对手排名24。

1702378540

1702378541 研究过程中，一个现象引起了我们的注意，那就是惩罚与较差的成绩之间有着十分明显的联系。表现最佳的6个人一直都没有使用过惩罚手段。相比之下，成绩最差的玩家，也是使用惩罚手段最频繁的几个人。研究显示，分数最低的玩家，使用惩罚手段最频繁，因而激起了报复的恶性循环，对所有参与其中的人都造成了毁灭性的后果。也就是说，亨利惩罚萨丽的背叛行为，从而引发了萨丽采取反惩罚手段。亨利忍无可忍，决定进一步惩罚对方。于是，双方便踏上了相互惩罚的不归路。

1702378542

1702378543 也许，得到这样的结果纯属侥幸。也许我们的赢家不过是运气好，遇到了也愿意采取合作的对手。我们进行了更为深入的分析，对玩家以惩罚手段应对背叛的概率进行了测算。那些成绩较好的玩家，不会将斗争升级为报复性惩罚，而会停留在背叛的层面上，以背叛来应对背叛。其中传达出来的信息十分明确：惩罚者不是赢家。这样一来，当博弈将重复性考虑在内时，喜欢充分利用手中权限进行惩罚的玩家，其行为通常都没有好的实质效果。

1702378544

[ 上一页 ] [ :1.702378495e+09 ] [ 下一页 ]