1701030039
无知的博弈:有限信息下的生存智慧 与上帝博弈
1701030040
1701030041
单人决策问题,一般不认为是博弈问题。但是,博弈论对于考察单人面临的不确定决策问题也是适用的。我们可引入一个虚拟的参与人──上帝,他的策略空间就是随机试验的各种状态;然后假设参与人是跟上帝进行博弈。上帝对任何结果的偏好都是一样的,所以他事先随便选择了他的策略,但你并没有观察到上帝的选择。而你,则需要考虑如何才能更好地对付上帝,使自己的(预期)赢利达到最大。正所谓与天斗,其乐无穷。现在我们来看几个与上帝博弈的例子。
1701030042
1701030043
该不该改变最初的选择
1701030044
1701030045
下面要讲到的例子与美国20世纪70年代的一个电视节目有关,其中的概率计算曾困扰着成千上万的大众。在节目中,节目参与者将在三扇门之间选择其中一扇。这三扇门中有且仅有一扇门的后面放着奖品,另外两扇门则放着讽刺性礼品比如鸡崽(chicken)或者笨驴(donkey)[1]。当节目参与者选定一扇门之后,主持人就会打开另外两扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中,主持人会问参与者要不要改变最初的选择。
1701030046
1701030047
这里的问题就是:参与人希望获得奖品,而不是获得讽刺性礼品,那么现在仍关闭的两扇门中,他应当坚持最初的选择呢?还是改变主意选择另外一扇门?
1701030048
1701030049
大多数人凭直觉认为,剩下的两扇门中,每扇门后有奖品或没有奖品的概率各占50%。因此,改变主意选择另外一扇门和坚持最初的选择不改变,预期的赢利是一样的。的确,这种思路看来是没有什么错。因为在做最初的选择时,选择“碰巧是”正确的概率为1/3;而一旦选择之后,剩下两扇门,参与者从主持人的行为中所能得到的信息就只是将信念修正为自己选择正确的概率为1/2,选择失误的概率也是1/2。此外没有任何其他的信息改善。因此,他坚持原来的选择似乎可以说得过去。
1701030050
1701030051
但是,上述看法并不符合真实的情况。真实的情况是,若参与者改变自己最初的选择,那么获得奖品的概率是2/3,若不改变最初的选择,则获得奖品的概率仅为1/3。他应该改变自己最初的选择。
1701030052
1701030053
奇怪的是,将这个结果告诉参与者后,他们还常常难以理解为什么会这样。一种比较浅显的解释是这样的:在最初的选择中,选择了错误门的概率是2/3。如果参与人一开始的确选择了错误的门,那么主持人随后必然打开空门,而没有被打开的那一扇就必然有奖品,此时参与人显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初的选择中参与人的确选正确了(概率为1/3),那么他显然应该坚持,并因此获得奖品。也就是说,如果参与人一开始就选错了,则参与人应该换门并一定获得奖金,如果参与人一开始就选对了,则应该坚持并一定获得奖金──于是,转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始,选择错误的概率是2/3,正确的概率是1/3。因此,在不知自己选择是正是误的情况下,在第二阶段改变主意转换到另一扇门,的确增加了获得奖品的概率。
1701030054
1701030055
对于有些喜欢做实验的读者,如果你不明白上述道理,那么我建议你做这样一个游戏:准备三张扑克和一枚硬币,让你的朋友来当节目主持人将三张牌铺在桌面上(并将那枚硬币放在其中一张之下);然后你来选择一张牌;你的朋友从你没选取的牌中拿走没有硬币的一张,再问你是否改变你当初选的牌。为了证明转换选择比不转换选择更有可能获得奖品,你可以尝试以“转换选择”为策略进行数十次(比如50次)实验,再以“不转换选择”为策略进行同样多次数(比如50次)的实验。结果你会发现什么?你将发现“转换选择”的策略中得到硬币的次数基本上是“不转换选择”策略中得到硬币的次数的两倍,而这两种策略中硬币出现的频率也基本上分别接近2/3和1/3。
1701030056
1701030057
当然,在一次性节目中,并不允许这样的重复实验。而且大多数人的确也不明智地选择了“不转换选择”。我曾在学生中做过这个实验,结果32人中有20人坚持“不转换选择”。这说明大多数人不清楚这样复杂的概率思考。更有意思的是,我跟我太太玩这个游戏时,她也是坚持“不转换选择”。当我告诉她如果转换可以成倍提高获奖概率时,她却说:如果我开始选对了,转换后结果错了就会后悔,所以心理素质好的就不应该转换。当然,她说的已经不是纯粹的概率计算,但也不是没有道理的。人们的行为的确不仅受制于各种精心的算计,也往往受制于某些心理因素(比如后悔)。不过,我对她的答案疑问在于:“如果开始选择对了,那么后来转换了选择会令人后悔。但是,如果后来你知道开始的选择错了,而你又没有转换选择,你就不后悔没有转换吗?”太太的回答更经典:“一开始选择错了,我只认为是运气不好,没什么可后悔的;如果开始对了,后来转换错了,才是后悔的。”这让我立即想到人们日常生活中常提到的道理:从没得到的东西,也就不会有失去它的痛苦,而已经得到的失去了,就会深感创伤[2]。从太太的回答中,我突然明白了为什么行为博弈理论(behavioral game theory)现在大行其道。
1701030058
1701030059
从没得到的东西,也就不会有失去它的痛苦,而已经得到的失去了,就会深感创伤。
1701030060
1701030061
乘车的最佳策略
1701030062
1701030063
一名游客要去某风景区游玩。每天开往风景区的只有三辆交通车,两趟车前后的间隔时间为5分钟。三辆车票价相同,但舒适程度则有高、中、低之分。这个游客不知道哪辆车最舒适,也不知道汽车开过来的顺序。不过对于他来说,多等5分钟或10分钟时间并无所谓,关键是要坐上最舒适的那辆车。
1701030064
1701030065
那么这名游客采取什么样的候车策略,才最可能搭上最舒服的那辆车呢?
1701030066
1701030067
这个问题,当然是一个单人决策问题,是不确定环境下的决策问题。这里的不确定性,源于游客对于不同舒适程度的三辆车开过来的顺序并不清楚。但列举起来,行车顺序无非有如下六种状态:上中下、上下中、中上下、中下上、下中上、下上中。那么我们可以虚拟一个参与人,即上帝,他选择的策略空间就是这六种状态。而且上帝这个参与人比较奇怪的一点就是,选择任何状态对他的赢利都是一样的,所以他在这六个策略之间以相同的频率随机地选择。
1701030068
1701030069
游客的目的是希望尽可能搭乘最舒适的车。他可以考虑的最简单的候车策略是:任意选择一辆车搭乘。他这样“随便”的选择,使他搭乘到最舒适的车的概率为1/3,这个结果一般的读者都能明白。
1701030070
1701030071
当然,游客也可以设计复杂一点的策略:第一辆车不上,如果第二辆比第一辆好就上第二辆,如果第二辆比第一辆差就上第三辆。这样的策略会使其搭上最舒适的车的可能性是多少?不妨把上帝可以选择的六种状态全列举出来,然后看看在哪些状态下,游客的这个策略刚好使他能够搭上最舒适的车(见图2-1):
1701030072
1701030073
1701030074
1701030075
1701030076
图2-1 行车顺序的各种状态与游客策略成功性
1701030077
1701030078
统计一下,读者会发现,采用这个相对不那么“随便”的策略,游客乘上最舒适汽车的概率是1/2。比之“随便”策略下的概率1/3,游客现在搭上最舒适汽车的可能性增加了1/2-1/3=16.7%。
1701030079
1701030080
这个编造出来的简单例子,说明了生活中一个很朴实的道理:存在多个候选对象的时候,没有必要仓促做决定,等一等,看一看,比较比较,可以提高获得最佳对象的概率。这里的候选对象,可以是商业计划方案,也可以是待购的物品,当然也可以是待雇用的求职者,或者是你中意的女孩──比如下面这个更复杂一点的例子。
1701030081
1701030082
存在多个候选对象的时候,没有必要仓促做决定,等一等,看一看,比较比较,可以提高获得最佳对象的概率。
1701030083
1701030084
怎样最大可能得到最好的女孩
1701030085
1701030086
人们常常希望能够获得一个最可爱的人作为自己的伴侣。但是,由于上帝在你的生命中安排的异性并不是同时出现任你挑选,因此无论你在何时选择结婚都是有机会成本的。也许你很早就结婚了,但是结婚之后却又不断发现还有不少更好、更合适的潜在婚姻对象,这就是结婚太早的机会成本。那么,是不是晚一点结婚就可以避免这个问题呢?不是的!当结婚太晚,你错过最合适的异性的可能性也就更大,这就是结婚太晚的机会成本。
1701030087
[
上一页 ]
[ :1.701030038e+09 ]
[
下一页 ]