打字猴:1.70237851e+09
1702378510 对这些实验结果仔细观察,就会发现,惩罚组的平均回报低于控制组得到的回报。在公共品博弈中,惩罚的手段的确可以强迫玩家进行合作,但其成本过高,将合作带来的优势也破坏掉了。换句话说,如果根本不给玩家以惩罚的机会,反而可能会得到更好的结果。
1702378511
1702378512 这场博弈中也带有一些人工雕琢的痕迹。一轮公共品博弈紧跟着一轮惩罚博弈。公共品博弈中,玩家被告知谁贡献了多少,但在惩罚博弈中,却无法得知是谁惩罚了自己。这样,惩罚就以匿名的方式进行,根本不用担心有人报复。实验的设计初衷,就是要让惩罚行为以最有效的方式进行。而现实生活则非常不同。当我们对他人进行惩罚的时候,人们通常知道是谁在惩罚他们,我们也要时刻准备好应对他人的报复行为。
1702378513
1702378514 在进化发展的历史过程中,我们的祖先什么时候遇到过费尔—盖其特实验中这样独特的情况:我们知道谁在公共品博弈中作出了贡献,却不知道接下来的一轮中,是谁惩罚了我们?
1702378515
1702378516 加州大学圣塔芭芭拉分校的进化心理学家约翰·托比(JohnTooby)指出,在人类思想进化的绝大部分时期里,人类都生活在小范围的群体之中,彼此之间经常相遇。古代社会中,人们很可能知道,怀有敌意的部落成员之间互相做了些什么。在小群体中生存,谁也不知道哪天就会需要某人的帮忙。因此,为了和部落成员搞好关系,就存在合作的压力。甚至在匿名的现代社会之中,虽然存在着一次相遇、终生不见的可能性,譬如在公路上或城市中,但我们还是会想一想,这位撞上我们的陌生人,或那位差点儿把我们弄伤的骑行者,很可能会再次出现在我们的生活中,出现在工作交流、朋友聚会等场合中。
1702378517
1702378518 试图排除重复和名声因素的所谓“一次性”实验,有些令人难以理解。原因在于,这样的实验与实际情况相差太远。我们所有的本能、直觉和行为,在世世代代的传承中逐渐成形,而且就是在人与人之间不断相遇、名声会发生作用的环境中定型的。因此,从一次性实验中对人类行为的普遍真理进行推论,是十分危险的举动。罗伯特·特里弗斯(RobertTrivers)在讨论费尔—盖其特实验时曾评论道,生物学家在实验室中饲养蜘蛛,是为了研究其生活习性,但这并不意味着,生物学家认为蜘蛛是在实验室环境中完成进化的。
1702378519
1702378520 如果现实生活中的惩罚,经常发生在人们知道是谁惩罚了谁这样不断重复的活动之中,那么就很难真正利用匿名惩罚实验中得出的结论。如果我们想要了解人类行为,以及合作与惩罚之间的相互关系,我们就需要对玩家会经常相遇的情形加以研究。脱离直接互惠与间接互惠的稳固框架去研究人类行为,意义不大。日常生活中所有重要的互动,都是在“重复”和“名声”存在的条件下发生的。
1702378521
1702378522 超级合作者 [:1702376345]
1702378523 真正的赢家无须惩罚
1702378524
1702378525 在这样一个黄金时代,没有威压,没有法律,善良与真实以最自然的状态勃发出来。不存在恐惧或惩罚,青铜碑文中看不到威胁的语句。人们也不惧怕法官的表情,因为他们可以在没有保护的环境中安全地生活。
1702378526
1702378527 罗马诗人奥维德,《变形记》
1702378528
1702378529 在哈佛的一天,一位来自瑞典的硕士生登门拜访了我。她对参加实验室的研究工作抱有非常大的热情。她名叫安娜·德莱博(AnnaDreber),在斯德哥尔摩市政厅长大。她的母亲是一位严苛的女权主义者、政治家兼道德活动家,曾担任副市长一职。安娜就是在市政府里面长大成人的。市政府大楼始建于20世纪20年代,带有典型的文艺复兴时期的宫殿风格。大楼围绕着两处露天广场——花园(Borgargarden)和蓝厅(Blue Hall)建成。每逢12月,当瑞典漆黑的夜空被闪耀的水晶灯点亮时,安娜都能亲身体会到诺贝尔晚宴时的炫目与繁华。
1702378530
1702378531 现在,她就坐在我面前,说她愿意做我的博士生,并以理论和计算为基础,为我们的进化博弈论体系增添一些与真实生活贴近的实验。几周之后,安娜发现,我们可以申请使用哈佛商学院的实验研究计算机实验室。实验室距离我们的办公室不远,里面满是现代化设备,四处是闪耀的屏幕和智能蓝牙装置。在这里,学生们可以用很少的资金投入,进行任何风格、规模和形式的博弈,从而对合作的世界进行进一步探索。
1702378532
1702378533 我们决定设计一个更加平衡的实验,来评估惩罚带来的影响。我们都感觉,以前的绝大多数实验,其设计初衷都有意夸大了惩罚的正面效果。现在我们想要进行的实验,不会刻意压制负面效果。当然,实验能否进行,还要看道德委员会是否批准。没想到,我们竟然不能在商学院进行任何与背叛有关的实验,如果想做,只能去心理学系。有幸的是,商学院允许我们在实验中增加与惩罚相关的元素。
1702378534
1702378535 全球金融危机之前,各地经常举办各类庆典活动。在诺瓦基亚的一次聚会上,我介绍安娜与大卫·兰德认识。他们谈得十分投机,决定共同工作。大卫有着非常与众不同的背景。他是在各类飞机旁边长大的。他的父亲是康奈尔大学应用数学系教授,非常热爱飞行,并且让儿子从很小的年纪就学习控制飞机操纵杆。要想成为一名优秀的飞行员,往往首先就需要拥有清晰的头脑,这也解释了大卫为什么拥有如此渊博的知识。他是哈佛大学第一位系统生物学毕业生,既是一名理论学家,也是一名实验主义者,如今经常与心理学家、经济学家和法学教授共同工作。他的才华远不止于学术领域,他还是位摇滚歌手,吉他玩得相当精妙,在YouTube上也能找到他的歌。
1702378536
1702378537 特殊的环境会造就特殊的行为,因此,大卫、安娜和我决定看一看,玩家之间的重复性相遇是否会对代价高昂的惩罚效果带来影响。我们与哈佛大学经济博弈论领域的著名专家朱·弗登伯格合作,请104名本科生参与了重复性两人囚徒困境的变体博弈。成对的两位玩家可以在合作、背叛和代价高昂的惩罚三者之间进行选择。“合作”意味着为了让对方得到3块钱,而支付1块钱。“背叛”意味着从对方处拿走1块钱。“惩罚”意味着为了让对方输掉4块钱,而支付1块钱。我们的实验设计与之前讲过的实验之间有很大的不同,最重要的是,我们允许玩家去满足自身报仇雪恨的欲望——如果艾丽斯惩罚了鲍勃,那么鲍勃就有机会在下一轮惩罚艾丽斯。
1702378538
1702378539 我们观察了成对玩家之间的1 230次重复性互动,每一次互动的时长在1轮~9轮之间不等。观察玩家的博弈实况是件很有意思的事情。这次实验的成果论文刊载在了《自然》杂志上。论文中的第二幅图表显示了代价高昂的惩罚所带来的影响。一对在4轮中保持合作的玩家,分数并列第一。那些忍受暴力、不愿反抗的玩家,成绩也很不错。在连续的两轮中,一位玩家虽然每次都遭到背叛,却始终坚持合作,之后继续维持宽容大度的心态,最终赢得了总分第六的成绩。而与他对弈的那位背叛者,在最后3轮中被感化成为合作者,最后的总分排名第19。还有一位合作者在背叛的行为面前忍无可忍,以惩罚的手段予以应对。5轮之后,背叛者还是没有在惩罚的压力面前采取合作。最终,他们分别获得了第25名和第22名。有一位合作者,在遇到背叛者的时候,以惩罚作为回应。这样就触发了背叛者的报复性惩罚,之后便是一轮接一轮的惩罚与反惩罚行为。这场相互打击博弈中的两位玩家,最终排名第30位和第25位。在一对玩家之间,我们还看到了先发制人实施打击的结果。在相互合作之后,一人实施惩罚,这激起了双方的背叛。惩罚者最后排名29,他的对手排名24。
1702378540
1702378541 研究过程中,一个现象引起了我们的注意,那就是惩罚与较差的成绩之间有着十分明显的联系。表现最佳的6个人一直都没有使用过惩罚手段。相比之下,成绩最差的玩家,也是使用惩罚手段最频繁的几个人。研究显示,分数最低的玩家,使用惩罚手段最频繁,因而激起了报复的恶性循环,对所有参与其中的人都造成了毁灭性的后果。也就是说,亨利惩罚萨丽的背叛行为,从而引发了萨丽采取反惩罚手段。亨利忍无可忍,决定进一步惩罚对方。于是,双方便踏上了相互惩罚的不归路。
1702378542
1702378543 也许,得到这样的结果纯属侥幸。也许我们的赢家不过是运气好,遇到了也愿意采取合作的对手。我们进行了更为深入的分析,对玩家以惩罚手段应对背叛的概率进行了测算。那些成绩较好的玩家,不会将斗争升级为报复性惩罚,而会停留在背叛的层面上,以背叛来应对背叛。其中传达出来的信息十分明确:惩罚者不是赢家。这样一来,当博弈将重复性考虑在内时,喜欢充分利用手中权限进行惩罚的玩家,其行为通常都没有好的实质效果。
1702378544
1702378545 奖励优于惩罚
1702378546
1702378547 着手进行这项研究时,关于成对玩家重复相遇并采取惩罚手段这其中的智慧,我们提出了一些思考。但我们研究的双人博弈并不属于公共品博弈的范畴。以前讲过,公共品博弈是玩家超过两人的囚徒困境。因此,我们的结论并不能简单地推及到之前其他学者进行的研究工作上,也无法用来评论费尔和盖其特的实验。费尔—盖其特实验的总结观点是,在维持公共品博弈的合作关系过程中,惩罚比奖励更加有效。于是,我们决定与在斯德哥尔摩经济学院工作的挪威人、瑞典著名经济学家托尔·埃林森(Tore Ellingsen)共同协作,展开一场我们自己的公共品博弈。
1702378548
1702378549 这场实验共有192人参加。实验对象4人一组,分别有16个控制组和32个实验组。实际上,我们大致遵从了费尔—盖其特最初的博弈设置,但在其中加入了另一项元素。我们允许了玩家之间的重复相遇,而非匿名相遇。这样一来,就可以知道是谁在惩罚谁。
1702378550
1702378551 我们进行了3场“诊疗”实验和一场控制实验。控制实验就是标准的公共品博弈。一号诊疗实验中加入了惩罚机制,二号诊疗实验中加入了奖励机制,三号诊疗实验中加入了惩罚与奖励机制。成本如下:“惩罚”意味着为了给他人造成损失,你要付出;“奖励”意味着为了让他人有所收获,你要付出。每组进行长达50轮的博弈。
1702378552
1702378553 实验过程中,3支诊疗组均出现了合作,而控制组则陷入了典型的“公地悲剧”之中。然而,虽然惩罚可以引发合作,但其成本却十分高昂,而最终的总分也与控制组一样低。相比之下,奖励诊疗组在公共品博弈过程中也保持了很高的贡献数额,总分也比控制组高出许多。我们发现,在同时给出惩罚和奖励两种选择的情况下,获胜的小组并不会使用成本高昂而无效的惩罚机制。从有益于公共事业并促进合作的角度讲,奖励比惩罚更加有效,虽然搭便车的行为屡屡从中造成破坏,但也无法影响这样的结论。
1702378554
1702378555 从这场实验之中,我们总结出了一个简单的心得:通过将公共品博弈与定向互动博弈联系在一起,就能解决公地悲剧。也就是说,与其停止合作并影响到传统公共品博弈中的所有玩家,不如只停止与那些背叛者的合作,甚至还可以对其他的合作者予以奖励。公共品博弈中的合作者能赢得好名声,使得其他的合作者更愿意与他们进行私下一对一的交易,就像那些有绿色环保名声的公司更容易获得商业机会一样。这一引导合作的策略十分简单有效。我们于2009年将研究成果发表于《科学》杂志时,文章的题目就是《积极互动促进公共合作》(Positive Interactions Promote Public Cooperation)。
1702378556
1702378557 超级合作者 [:1702376346]
1702378558 惩罚的负面作用
1702378559
[ 上一页 ]  [ :1.70237851e+09 ]  [ 下一页 ]