打字猴:1.701028502e+09
1701028502 合作的进化(修订版) [:1701027608]
1701028503 合作的进化(修订版) 第四部分 对参与者和改革者的建议
1701028504
1701028505 合作的进化(修订版) [:1701027609]
1701028506 第六章 如何有效地选择
1701028507
1701028508 虽然预见对于合作的进化不是必要的,但它却对我们很有帮助。因此这一章和下一章将分别对参与者和改革者提供建议。
1701028509
1701028510 这一章为那些处于“囚徒困境”的人提供建议。从个体的眼光看,目标是在与对手的一系列对局中尽可能地得高分。由于这个游戏是“囚徒困境”,参与者会受到背叛的短期诱惑,但是通过与对方建立双方合作的模式可以得到更多的长期好处。对计算机竞赛的分析和理论研究的结果,为我们提供了一些有用的信息,即在不同的条件下什么样的策略会起作用和为什么这些策略能表现得好。这一章就是把这些发现转化成对参与者的建议。
1701028511
1701028512 在持续的“重复囚徒困境”中应如何表现,下面是四个简单的建议:
1701028513
1701028514 1.不要嫉妒;
1701028515
1701028516 2.不要首先背叛;
1701028517
1701028518 3.对合作与背叛都要给以回报;
1701028519
1701028520 4.不要耍小聪明。
1701028521
1701028522 不要嫉妒
1701028523
1701028524 人们习惯于考虑零和博弈,在这种情况下,一个人赢,另一个就输。一个很好的例子就是下棋比赛。为了能赢,一个参赛者必须在大部分时间里比对手做得更好。白棋赢黑棋就输。
1701028525
1701028526 然而生活中的大多数情况都是非零和的。一般来说,双方可以都做得很好,也可以都做得很差。双方的合作是可能的,但并不是总能实现。这就是为什么“囚徒困境”是各种各样的日常情形的有用模型。
1701028527
1701028528 在我的课堂中,我经常让几对学生玩几十步“囚徒困境”游戏。我告诉他们目标是他们自己得分,就像每一分就是一美元一样。我还告诉他们不要理会他们的得分是比对手好一些或差一些。只要他们能得到尽可能多的“美元”。
1701028529
1701028530 但是,这些指导一点也不起作用,学生们总是要找一个相对的标准来衡量他们是做得好还是做得差。他们通常使用的标准是把他们的得分与对手的得分相比较。迟早,一个学生为了领先或为了看看会发生什么而背叛,另一个学生也不甘落后而背叛。因此,情况由于双方的相互报复而恶化了。不久双方便会认识到他们做得不够好,其中一人试图恢复双方的合作,但另一个人不能肯定这是否是对方的一个花招,担心一旦合作开始后又要被占便宜。
1701028531
1701028532 人们倾向于采用相对的标准,这个标准经常把对方的成功与自己的成功联系起来。[1]这种标准导致了嫉妒,嫉妒又导致企图抵消对方已经得到的优势。在“囚徒困境”的形式下,抵消对方的优势只能通过背叛来实现。但是背叛导致更多的背叛和对双方的惩罚。因此嫉妒是自我毁灭。
1701028533
1701028534 要求自己比对方做得好不是一个很好的标准,除非你的目的是消灭对方。在大多数情况下,这个目的是不可能实现的,或者追求这个目的有可能导致危险的冲突。如果你并不想消灭对方,比较你的得分与对方的得分就可能产生自我毁灭的嫉妒。一个更好的相对标准是把你所做的与处在相同情况下的其他人所做的做比较。对于一个给定的对方策略,你是否做得最好?其他人在这种情况下能做得更好吗?这就是检验表现是否成功的一个很好的标准。[2]
1701028535
1701028536 “一报还一报”由于与其他多种多样策略相处得很好而赢得了竞赛。平均来说,它比竞赛中的其他任何策略都做得更好。但是“一报还一报”从来没有一次在游戏中比对方得更多的分!事实上,它不可能比对方多得分。它总是让对方先背叛,并且它的背叛次数绝不比对方的多。因此“一报还一报”不是得到和对方一样多的分,就是比对方略少。“一报还一报”赢得竞赛不是靠打击对方,而是靠从对方引出使双方有好处的行为。“一报还一报”如此坚持引出双方有利的结果,从而使它获得比其他任何策略更高的总分。
1701028537
1701028538 因此在一个非零和的世界里,为了你自己做得好,你没有必要非得比对方做得更好。特别当你要和许多不同的对手打交道时更是这样。只要你自己能做得更好就让他们每个人做得和你一样或略好些。没有理由去嫉妒对方的成功。因为在长时间的“重复囚徒困境”中,其他人的成功是你自己成功的前提。
1701028539
1701028540 国会是一个很好的例子。国会议员可以相互合作而不威胁到各自在选区的名望。对于一个议员的主要威胁不是另一个来自这个国家其他地区的议员的相对成功,而是来自可能在选区进行挑战的人。因此妒忌其他议员从双方合作得来的成功是没有多大意义的。
1701028541
1701028542 在生意场中也是这样,一个从供应商那儿买来东西的公司期望有一个供方和买方都有好处的成功的关系。妒忌供方的利润是完全没有意义的。任何通过不合作行为(如不按时付账)来减少这种利润的企图,都将激起供方的报复行动,报复行为可以采用多种形式,经常以不明显惩罚形式,诸如拖延发货,较低的质量保证,不愿意打折扣,或者不交换市场条件变化的信息(Macaulay 1963)。这种报复使得嫉妒代价很大。买者不要担心卖方的相对利润,而可以考虑是否有其他更好的购买策略。
1701028543
1701028544 不要首先背叛
1701028545
1701028546 竞赛和理论分析的结果都表明,只要对方合作,你合作就会有好处。第二章中的竞赛结果是很令人吃惊的。决定一个规则表现如何的唯一最好的特征是这个规则是否善良,也就是说这个规则是否不首先背叛。在第一轮竞赛中,前8名规则都是善良的,在后7名规则中没有一个是善良的。在第二轮竞赛中,前15名规则中只有一个是非善良的(它名列第8),而后15名规则中只有一个是善良的。
1701028547
1701028548 有些不善良的规则,使用相当复杂的方法来试探它是否能逃脱惩罚。例如“检验者”尝试在第一步背叛,如果对方报复的话,它就马上撤回。在另一例子中“镇定者”倾向于在背叛前等待十几步,看看对方是否能被哄骗和被偶尔占便宜。如果是的话,“镇定者”就更频繁地增加背叛,直到对方反击而被迫撤回。但是这些尝试首先背叛的策略都表现得不怎么好。因为存在许多由于愿意报复而不被占便宜的策略,所以导致冲突的代价有时是很高的。
1701028549
1701028550 甚至许多专家也没有意识到善良性对避免不必要的冲突的价值。在第一轮竞赛中,由对策专家送来的规则中几乎有一半是不善良的。参考了第一轮的明显结果,第二轮比赛中大约有1/3的规则采用不善良的策略,但是,它们都没有占到便宜。
1701028551
[ 上一页 ]  [ :1.701028502e+09 ]  [ 下一页 ]