1701092687
疯狂实验史 1950 心地善良,但别做傻瓜!
1701092688
1701092689
1950年1月的一个下午,数学家梅里尔·弗勒德和梅尔文·德雷舍(Melvin Dresher)向2位同事展示了他们上午发明的一个小游戏。游戏很简单,游戏双方只要同时说出A或B即可。人们当时没有想到,如此简单的游戏日后引起了政治家和将军们的浓厚兴趣。每个回合开始前,双方各在心中选定A或B,分别代表着“合作”与“不合作”。然后2人同时说出心中的字母。如果出现一致,那么两人都能得到奖励,如果不一致,则可能受罚。游戏应当持续上百回合。数学家之所以发明这个小游戏,是基于对数学领域“博弈论”的研究。博弈论是利用数学技巧研究冲突与竞争。例如在经济领域。买方希望以尽量低的价格购入商品,而卖方则希望以尽量高的价格卖出商品。最终的价格不取决于买方期望与卖方期望的任一方,而是被共同决定着。有时价格是非理性的,它不以卖方利润最大化为目标。博弈论中的冲突有趣之处在于:在公开心中答案那一瞬间,没人知道对方的答案,但是最终的结果却取决于双方答案的契合度。
1701092690
1701092691
弗勒德和德雷舍的游戏也是这样。阿芒·阿尔奇安和约翰·D·威廉姆斯在进行游戏时,每回合的结果都不外乎以下4种情况:2人均选择合作;两人均选择“不合作”,阿尔奇安选择“合作”,而威廉姆斯选择“不合作”;以及后者选择“合作”,而前者选择“不合作”。在各种情形下,他们所获得的奖赏或惩罚都写明在一张表格上。他们对表格进行仔细研究后,发现了他们在游戏中的两难处境:当两人都选择“合作”时,阿尔奇安能得到0.5美分奖赏,而威廉姆斯却能得到1美分。当两人均选择“不合作”,所得奖赏各减0.5美分,阿尔奇安得到的奖赏为0,威廉姆斯仍能得到0.5美分。这样看来,似乎双双选择“合作”,是他们最好的策略。然而问题在于,当两人的选择不一致时,选择“合作”的会遭到惩罚,而选择“不合作”的则会得到奖赏。
1701092692
1701092693
也就是说,如果威廉姆斯选择“不合作”,而阿尔奇安选择了“合作”,那么他将受到l美分的惩罚,而前者则将收获2美分。反之,威廉姆斯将受到l美分的惩罚,而阿尔奇安将得到l美分奖赏。然而他们在这个游戏中的两难处境并非起因于不同的奖罚程度。
1701092694
1701092695
因为任何一位游戏者都无法事前洞察对方的心理,最后他们都会得出同一个结论,选择“不合作”是最好的策略——一旦对方选择“合作”,自己将得到奖赏。即便最差的情况下,对方也选择“不合作”,至少也不会遭到惩罚。约翰·纳什(John Nash)在极小极大理论中,预见了这种情形。
1701092696
1701092697
这种表面上最佳的理性选择最后会导致一个荒谬的结果:双方每个回合都选择“不合作”。在此情形下,迟早他们会发现最终得到的奖赏远不如“不理性”地选择“合作”得到的多。逻辑最终混淆了游戏者的判断,遮蔽了他们最好的选择。
1701092698
1701092699
如同弗勒德和德雷舍猜测的一样,阿尔奇安和威廉姆斯没有陷入纳什理论所预测的逻辑怪圈中,他们的选择是“非理性”的。阿尔奇安在100个回合的游戏中,68次选择了“合作”,威廉姆斯则有78次。
1701092700
1701092701
弗勒德和德雷舍将这次有趣的实验记录在内部研究备忘录里。认真读过这本备忘录的人,无不隐隐感觉到这项实验的伟大之处。备忘录中还有阿尔奇安和威廉姆斯在游戏时做的笔记。
1701092702
1701092703
“他现在可能明白了。”
1701092704
1701092705
“好点了。”
1701092706
1701092707
“这个猪头!”
1701092708
1701092709
“他疯了吧?”
1701092710
1701092711
“看看他是不是变聪明点了。”
1701092712
1701092713
“他想吃独食啊。。
1701092714
1701092715
“我的天!他也太好了!”
1701092716
1701092717
“这简直不像话。”
1701092718
1701092719
这个游戏中充斥着信任与欺骗。从中人们能看出不少社会中存在的基本问题:个体与集体的矛盾。个体与集体关系融洽,能带来利益,然而另一方面,它们也可能给人类社会的福祉带来巨大的危害。
1701092720
1701092721
这个游戏之所以后来蜚声四起,原因不在于它所设计的不等的奖惩幅度。弗勒德和德雷舍的一位同事——阿尔伯特·塔克(Albert Tucker)对游戏中的两难现象进行了进一步的阐述,并赋予它一个响亮的名字:囚徒的两难处境。塔克也因此而闻名天下。关于塔克对囚
1701092722
1701092723
徒的两难处境的阐述,一个版本是这样的:某犯罪团伙的2名成员被捕,并被警察隔离审讯。警察缺乏指控两人主要犯罪事实的证据。然而警察拥有足够证据,起诉他们所犯下的其他次要罪行。法院基于这些次要罪行可宣判这2名犯罪嫌疑人入狱一年。现在警察单独向2人分别建议,指证对方的主要犯罪事实。作为交换,警方不再追求其次要罪行的责任,而另一名犯罪嫌疑人将面临3年的牢狱之灾。对任何一名犯罪嫌疑人来说,这么做的风险在于,他的同伙也可能同时指证自己,这样的话,2人都将入狱2年。
1701092724
1701092725
理性的犯罪嫌疑人一般会做如下思考:如果我出卖同伙,而他为我保守秘密,那么我能马上得到自由,而无须锒铛入狱。即使他也同时出卖我,那么我也只要坐2年牢,比起保守秘密而被同伙出卖坐3年牢来说,还是非常划算的。那么也就是说,只要我出卖同伙,不管他如何,我的处境都会更有利。问题在于,他的同伙也必然做出跟他一致的判断。最终的结果很可能是双方都入狱2年。假设2人都保持沉默、不揭发同伙,他们只要坐1年牢。
1701092726
1701092727
囚徒的两难处境有几个制度性前提:一项奖励制度,适用于双方都合作之时;一项处罚制度,适用于双方均不合作之时,一次提升奖励幅度的机会,当一方选择合作时,适用于不合作的另一方。
1701092728
1701092729
我们的世界充斥着“囚徒的两难处境”。例如偷税逃税、开黑车:只要其他人还在正常缴税、驾车,这种现象就会存在,而当所有人都不再缴税、违法驾车载客时,所有人都必然受到惩罚。
1701092730
1701092731
“囚徒的两难处境”另一个生动的例子便是美苏之间的军备竞赛。尽管弗勒德和德雷舍在当初设计那个游戏时,未曾想到这个问题,但是这其中的关联是无法割舍的。最终这2位数学家都服务于兰德公司——一家著名的美国军事战略研究所,位于洛杉矶旁的圣摩尼卡市。
1701092732
1701092733
2个大国打着这样的算盘:一旦对方生产研制核武器,而本方没有,那么本方将迅速处于下风。正是在这种想法的影响下,2国军备竞赛此起彼伏、甚嚣尘上。对2国来说,最安全的状态,恰恰是双方都不装备核武器。
1701092734
1701092735
自从弗勒德和德雷舍1950年发明了那个游戏后,“囚徒的两难处境”声名大噪,成为学术界的新宠。数学界、经济学界、心理学界,甚至生物学界都纷纷对此展开了研究。尽管从严格意义上讲,它是无法解答的——否则也不能称为两难处境了。但是利用博弈论,人们
[
上一页 ]
[ :1.701092686e+09 ]
[
下一页 ]