打字猴:1.701092686e+09

1701092686 疯狂实验史 [:1701091387]

1701092687 疯狂实验史 1950 心地善良，但别做傻瓜!

1701092688

1701092689 1950年1月的一个下午，数学家梅里尔·弗勒德和梅尔文·德雷舍(Melvin Dresher)向2位同事展示了他们上午发明的一个小游戏。游戏很简单，游戏双方只要同时说出A或B即可。人们当时没有想到，如此简单的游戏日后引起了政治家和将军们的浓厚兴趣。每个回合开始前，双方各在心中选定A或B，分别代表着“合作”与“不合作”。然后2人同时说出心中的字母。如果出现一致，那么两人都能得到奖励，如果不一致，则可能受罚。游戏应当持续上百回合。数学家之所以发明这个小游戏，是基于对数学领域“博弈论”的研究。博弈论是利用数学技巧研究冲突与竞争。例如在经济领域。买方希望以尽量低的价格购入商品，而卖方则希望以尽量高的价格卖出商品。最终的价格不取决于买方期望与卖方期望的任一方，而是被共同决定着。有时价格是非理性的，它不以卖方利润最大化为目标。博弈论中的冲突有趣之处在于：在公开心中答案那一瞬间，没人知道对方的答案，但是最终的结果却取决于双方答案的契合度。

1701092690

1701092691 弗勒德和德雷舍的游戏也是这样。阿芒·阿尔奇安和约翰·D·威廉姆斯在进行游戏时，每回合的结果都不外乎以下4种情况：2人均选择合作；两人均选择“不合作”，阿尔奇安选择“合作”，而威廉姆斯选择“不合作”；以及后者选择“合作”，而前者选择“不合作”。在各种情形下，他们所获得的奖赏或惩罚都写明在一张表格上。他们对表格进行仔细研究后，发现了他们在游戏中的两难处境：当两人都选择“合作”时，阿尔奇安能得到0.5美分奖赏，而威廉姆斯却能得到1美分。当两人均选择“不合作”，所得奖赏各减0.5美分，阿尔奇安得到的奖赏为0，威廉姆斯仍能得到0.5美分。这样看来，似乎双双选择“合作”，是他们最好的策略。然而问题在于，当两人的选择不一致时，选择“合作”的会遭到惩罚，而选择“不合作”的则会得到奖赏。

1701092692

1701092693 也就是说，如果威廉姆斯选择“不合作”，而阿尔奇安选择了“合作”，那么他将受到l美分的惩罚，而前者则将收获2美分。反之，威廉姆斯将受到l美分的惩罚，而阿尔奇安将得到l美分奖赏。然而他们在这个游戏中的两难处境并非起因于不同的奖罚程度。

1701092694

1701092695 因为任何一位游戏者都无法事前洞察对方的心理，最后他们都会得出同一个结论，选择“不合作”是最好的策略——一旦对方选择“合作”，自己将得到奖赏。即便最差的情况下，对方也选择“不合作”，至少也不会遭到惩罚。约翰·纳什(John Nash)在极小极大理论中，预见了这种情形。

1701092696

1701092697 这种表面上最佳的理性选择最后会导致一个荒谬的结果：双方每个回合都选择“不合作”。在此情形下，迟早他们会发现最终得到的奖赏远不如“不理性”地选择“合作”得到的多。逻辑最终混淆了游戏者的判断，遮蔽了他们最好的选择。

1701092698

1701092699 如同弗勒德和德雷舍猜测的一样，阿尔奇安和威廉姆斯没有陷入纳什理论所预测的逻辑怪圈中，他们的选择是“非理性”的。阿尔奇安在100个回合的游戏中，68次选择了“合作”，威廉姆斯则有78次。

1701092700

1701092701 弗勒德和德雷舍将这次有趣的实验记录在内部研究备忘录里。认真读过这本备忘录的人，无不隐隐感觉到这项实验的伟大之处。备忘录中还有阿尔奇安和威廉姆斯在游戏时做的笔记。

1701092702

1701092703 “他现在可能明白了。”

1701092704

1701092705 “好点了。”

1701092706

1701092707 “这个猪头!”

1701092708

1701092709 “他疯了吧?”

1701092710

1701092711 “看看他是不是变聪明点了。”

1701092712

1701092713 “他想吃独食啊。。

1701092714

1701092715 “我的天!他也太好了!”

1701092716

1701092717 “这简直不像话。”

1701092718

1701092719 这个游戏中充斥着信任与欺骗。从中人们能看出不少社会中存在的基本问题：个体与集体的矛盾。个体与集体关系融洽，能带来利益，然而另一方面，它们也可能给人类社会的福祉带来巨大的危害。

1701092720

1701092721 这个游戏之所以后来蜚声四起，原因不在于它所设计的不等的奖惩幅度。弗勒德和德雷舍的一位同事——阿尔伯特·塔克(Albert Tucker)对游戏中的两难现象进行了进一步的阐述，并赋予它一个响亮的名字：囚徒的两难处境。塔克也因此而闻名天下。关于塔克对囚

1701092722

1701092723 徒的两难处境的阐述，一个版本是这样的：某犯罪团伙的2名成员被捕，并被警察隔离审讯。警察缺乏指控两人主要犯罪事实的证据。然而警察拥有足够证据，起诉他们所犯下的其他次要罪行。法院基于这些次要罪行可宣判这2名犯罪嫌疑人入狱一年。现在警察单独向2人分别建议，指证对方的主要犯罪事实。作为交换，警方不再追求其次要罪行的责任，而另一名犯罪嫌疑人将面临3年的牢狱之灾。对任何一名犯罪嫌疑人来说，这么做的风险在于，他的同伙也可能同时指证自己，这样的话，2人都将入狱2年。

1701092724

1701092725 理性的犯罪嫌疑人一般会做如下思考：如果我出卖同伙，而他为我保守秘密，那么我能马上得到自由，而无须锒铛入狱。即使他也同时出卖我，那么我也只要坐2年牢，比起保守秘密而被同伙出卖坐3年牢来说，还是非常划算的。那么也就是说，只要我出卖同伙，不管他如何，我的处境都会更有利。问题在于，他的同伙也必然做出跟他一致的判断。最终的结果很可能是双方都入狱2年。假设2人都保持沉默、不揭发同伙，他们只要坐1年牢。

1701092726

1701092727 囚徒的两难处境有几个制度性前提：一项奖励制度，适用于双方都合作之时；一项处罚制度，适用于双方均不合作之时，一次提升奖励幅度的机会，当一方选择合作时，适用于不合作的另一方。

1701092728

1701092729 我们的世界充斥着“囚徒的两难处境”。例如偷税逃税、开黑车：只要其他人还在正常缴税、驾车，这种现象就会存在，而当所有人都不再缴税、违法驾车载客时，所有人都必然受到惩罚。

1701092730

1701092731 “囚徒的两难处境”另一个生动的例子便是美苏之间的军备竞赛。尽管弗勒德和德雷舍在当初设计那个游戏时，未曾想到这个问题，但是这其中的关联是无法割舍的。最终这2位数学家都服务于兰德公司——一家著名的美国军事战略研究所，位于洛杉矶旁的圣摩尼卡市。

1701092732

1701092733 2个大国打着这样的算盘：一旦对方生产研制核武器，而本方没有，那么本方将迅速处于下风。正是在这种想法的影响下，2国军备竞赛此起彼伏、甚嚣尘上。对2国来说，最安全的状态，恰恰是双方都不装备核武器。

1701092734

1701092735 自从弗勒德和德雷舍1950年发明了那个游戏后，“囚徒的两难处境”声名大噪，成为学术界的新宠。数学界、经济学界、心理学界，甚至生物学界都纷纷对此展开了研究。尽管从严格意义上讲，它是无法解答的——否则也不能称为两难处境了。但是利用博弈论，人们

[ 上一页 ] [ :1.701092686e+09 ] [ 下一页 ]