1704594400
1704594401
冷酷触发策略。在第一轮,我会选择“分享”,且只要对方也选“分享”,我会一直这样选下去。然而,如果对方在某一轮选了“拿走”(即便对方只选过这一次拿走),这之后的每一轮,我都会一直选“拿走”。
1704594402
1704594403
针锋相对策略。每一轮,我的选择都和对手上一轮的选择相同。
1704594404
1704594405
两名理性参与者(唯一的目的就是谋求个人的物质利益)如均使用冷酷触发策略,会一直处于双方均选合作(即均选“分享”)的均衡态势。对此的解释相当简单,首先请注意,两名参与者都使用冷酷触发策略的话,他们在第一轮就会选合作。二者知道对方选了合作后,在这一策略的指导下,第二轮会再次双双选择合作,同理第三轮也会选合作,以此类推。每一轮,双方选择合作,每人的总奖金都会增加50%。
1704594406
1704594407
只要对方坚持使用冷酷触发策略,两人选择其他任何策略都无法增加所得。诚然,如果一名参与者在某一轮选择“拿走”,而另一名参与者仍然使用冷酷触发策略,则选择“拿走”的参与者本轮可得100美元,比他选择“分享”的所得多50美元。但这样一来,他会触发对方的“惩罚措施”:在其后每一轮中(此后还有许多轮),对方无论如何都会坚定不移地选“拿走”,他每轮都会少拿50美元,而不是多拿50美元。须注意,这种情况下稳定的合作态势之所以能够形成,是因为不合作行为一旦出现,即会立即招来对方的报复,让对方也选择不合作,从而对不合作行为形成有效的震慑。
1704594408
1704594409
* * *
1704594410
1704594411
在瑞典斯德哥尔摩市发表诺贝尔奖获奖感言时,罗伯特·奥曼谈到了一个博弈论观点,内容与前几章提出的观点大同小异。他甚至断言,这一观点阐述了几乎所有国际冲突的本质,包括巴以冲突。其观点是,为预防流血冲突,人类需利用强硬战略,建立威慑机制,如美国和苏联在冷战时期采取的战略。该观点认为,唯有强大的威慑力才能防止人们在种种诱因之下诉诸武力冲突。
1704594412
1704594413
奥曼参加诺贝尔奖颁奖典礼后不久,几名媒体评论员联系了我,请我对此观点做出回应。我认为,虽然奥曼提出的观点奥妙之极,我也找不出哪个人拿诺贝尔奖能比他更实至名归,但这一领域那些天衣无缝的数据计算结果与适用于国际冲突的具体结论之间鲜有直接联系。威慑本身就是一种缺乏稳定性的局势,以此作为维护和平、预防流血冲突的基础并不可靠——任何风吹草动都可能激活“冷酷触发”。虽然理论模型表明,在建立威慑的情况下,合作可构成均衡态势,但一旦均衡态势被打破,和平与合作所仰仗的庞大体系就会轰然倒塌,因为构成威慑力的威胁因素很可能会引发全球规模的灾难(美国和苏联在冷战期间经常相互挑衅威胁。试想一下,假如两国真的言出必行,会发生什么事?)。
1704594414
1704594415
仅有威慑力还不够,除了以威胁为基础的威慑政策之外,我们还需构建体系,对双方进行正面诱导,如共同的经济利益可成为国际关系中的另一大稳定因素。与之同理的是,调动个人的积极性,要用恩威并施的措施。
1704594416
1704594417
奥曼在诺贝尔奖获奖感言中提出的某些观点招来了某些人的异议,这些人的行为远比我过火。一群以色列左翼分子正式向诺贝尔委员会发出申请,以奥曼的政见和他从科学研究中得出的政治教训为由,要求撤销颁给他的诺贝尔奖。这让我火冒三丈(这可能是非理性的情感反应)。假如对科学的管制不能偏离严格的政治正确路线,行业翘楚获奖与否仅以政见为依据,人类发展会停留在黑暗时代[1],止步不前。
1704594418
1704594419
针锋相对策略力度不及冷酷触发策略,但仍然能确保均衡状态的形成。针锋相对策略也会惩罚一方的不合作行为,但在此情况下,对不合作行为的惩罚仅限一轮,比冷酷触发策略的惩罚措施更加宽松。如果不合作者其后一轮重新选择合作,惩罚即告终止,双方会重新回到每轮都相互合作的态势。
1704594420
1704594421
事实证明,针锋相对策略会促成合作均衡态势的形成。两名参与者单方面选择不合作,都不会有好处。如果一方在几轮内选择不合作,然后重新选择合作,此后的博弈会重新回到合作路线上,但在此之前,其暂时不合作的行为造成的损失要大于所得。(得出这一结论须稍加计算,但各位愿意的话,可以自己试一试。一方仅有一轮选择不合作,会发生什么状况?他在这一轮的所得为多少?其后的损失又为多少?)
1704594422
1704594423
在我们目前所探讨的重复互动中,每一轮过后,双方都认为博弈继续下一轮的概率很高。其他情形会是什么状况?请思考两个具体例子。假设你要在西班牙马拉加市度假一周,假期第一天,你走进一家餐馆,对餐馆的美食赞不绝口,于是决定之后的整个假期,每天都去那里吃饭。你每次在餐馆入座,都是同一名服务生招待你,在这种情况下,你与这名服务生的交往实际上相当于重复6轮的囚徒困境(说6轮是因为假期还剩6天)。
1704594424
1704594425
合作,即服务生为你提供周到的服务,而你多付小费予以酬谢,这在这种情形中至关重要。须注意,在假期的每一天——除了最后一天,你都认为再次遇到这名服务生的概率很高。然而,在最后一天,你会认为在可预见的未来再也不会回到这家餐馆的概率很高,因为这是你假期的最后一天,机票早已订妥,第二天就得重新上班了。
1704594426
1704594427
冷酷触发策略能确保假期每一天都形成合作均衡吗?显然不能(此处仍然采取理性思维,唯一目的仅为从自私角度出发,最大程度地优化自己的物质条件)。即便服务生以为你会在这个城市长住,归期未定,也不可能确保你假期的每一天都能维持合作状态。原因很简单,在假期最后一天,(从自私角度来讲)你毫无理由付小费给服务生。你第二天回到同一家餐馆的概率微乎其微(航班可能会取消,所以我们姑且可以假设,这种概率虽然很低,但也不是不存在)。由此可见,如果你没有付小费就扬长而去,服务生在将来能以服务不周的方式惩罚你的概率微乎其微。
1704594428
1704594429
如果这名服务生足够理性、聪明且“自私而现实”,他会明白,即便他的服务无微不至,也总有一天你会不给小费就离开餐馆。仅这一点,或许就可以让他失去必须每天都待你周到的动力:
1704594430
1704594431
他明白无误地知道,总有一天没有小费可拿,只是不知道这一天究竟什么时候到来。
1704594432
1704594433
这样描述马拉加的度假者与本地服务生之间的奇特关系,或许看起来有些夸大其词,但实际上,这种情况的出现频率或许远高于各位的认知。众所周知,人们在经常光顾的本地餐馆所付的小费往往要多于偶然发现且以后不大可能再度光顾的外国餐馆,以本地居民为常客的餐馆所提供的服务也往往要优于敲游客竹杠的地方。
1704594434
1704594435
尽管如此,我们仍然经常付小费,即便付小费不会为我们带来任何实惠。我们为何要这样做?我们为何没有见缝插针地自私而为,抓住每一次利用“最后一天效应”的机会?(实际上,有人喜欢在假期最后一天多给小费,以对几天来享受到的周到服务表示感谢。)
1704594436
1704594437
不足为奇的是,答案在于我们的情感。请记住,在现实世界中,我们反反复复、不止一次地经历类似囚徒困境的情形。为了便于理解这一观点,请容许我介绍一下自动机的概念。
1704594438
1704594439
计算机科学家发明了自动机,但这一概念却广泛用于经济学和博弈论的诸多模型。我对其研究的绵薄贡献是,我认为尽管自动机指的是机器,情感也可以说是利用了自动机的原理。
1704594440
1704594441
自动机的定义由(且仅由)以下部分组成:
1704594442
1704594443
1.一组状态。
1704594444
1704594445
2.一组行为。
1704594446
1704594447
3.结果函数:通过指定的一对状态与行为生成一种新的状态。
1704594448
1704594449
4.行为函数:将每种状态与行为进行匹配。
[
上一页 ]
[ :1.7045944e+09 ]
[
下一页 ]