1701030010
博弈论是理论的科学,与他人博弈则还需要现实的经验。
1701030011
1701030012
逆概率推断
1701030013
1701030014
与上帝博弈时,人们会形成对上帝之选择的主观信念(上帝选择各状态的概率分布),但是某些时候一些相关的事件发生了,导致人们需要修正对于上帝之选择的信念。或者说,人们有时会面临这样的问题:需要从观察到的结果去推断潜在信息的可能性──估计潜在状态的概率。
1701030015
1701030016
需要从观察到的结果去推断潜在信息的可能性。
1701030017
1701030018
理解上述问题的最佳方式是举例。比如,上帝可以选择一个人是否患上某种遗传缺陷,并且一个人患上遗传缺陷的概率是1%。某项健康检查技术有99%的精确性可以发现这种遗传缺陷,即如果一个人真有遗传缺陷,那么他只有1%的机会未发现该缺陷;如果他没有遗传缺陷,但该项检查也有1%的机会误报其有遗传缺陷。我们感兴趣的是,当检查报告一个人有遗传缺陷的时候,他真的有遗传缺陷的概率是多少?也就是说,给定我们的观察,我们在多大程度上能确定潜在条件是现实存在的?
1701030019
1701030020
不妨用简单的数字运算来回答这个问题。设人口总数为10000人,其中100人(1%)有缺陷,而9900人没有。全部人口都做了该项检查,结果是100个有缺陷的人中被报告为确实有缺陷的人数为99人;而9900个无缺陷的人中也有99人被(错误地)报告为有缺陷。即检查报告为有缺陷的人数是198人,而这当中实际上只有一半(99)的人是真的有缺陷,另外一半实际上是没有缺陷的。所以,有缺陷报告只意味着被报告人有50%的概率存在遗传缺陷。
1701030021
1701030022
上述推理过程,是根据结果来推断概率,因此也被称为逆概率推断[2]。逆概率推断主要用到贝叶斯公式(见页下注或本书附录)。贝叶斯公式和逆概率推断思想在有限信息博弈分析中占有非常重要的地位。因为非对称信息博弈中,人们常常会通过观察对手的言行来判断对手的类型,或者说对手的言行往往传递着对手类型的信息,每当观察到对手的言行之后,博弈参与人就可以并且应当就这些观察到的言行对对手的类型进行重新推断以更新其信念,这种信念更新的逻辑过程正是按照贝叶斯公式来的。在第3章“察觉蛛丝马迹”一节,大家可以看到从对手言行推断对手类型信息在博弈中的重要性。
1701030023
1701030024
[1]自弗兰克·奈特(Frank Knight,1921)以来,有些经济学家也主张不确定性与风险是有区别的,他们认为不确定性无法知晓各状态实现的概率,而风险则可以估计出各状态实现的概率。不过,在本书中,不确定性与风险是当做同义词可轮换使用的。
1701030025
1701030026
[2]此类推断过程可以用贝叶斯定理进行一般化。譬如,可将两种潜在条件标记为A(代表有缺陷)和B(代表无缺陷),将两个可观察结果(事件)记为Y(检验结果有缺陷)和N(检验结果无缺陷)。在缺乏有关人口总体的信息下,假设A存在的概率为p,则B存在的概率为(1-p)。当A存在,观察到Y出现的概率为a,则观察到N出现的概率为(1-a)。同样,当B存在,观察到Y出现的概率为b,则观察到N出现的概率为(1-b)。于是我们得到四种组合情况,并可计算每种情况的概率:①A存在,且观察到Y,概率为pa;②A存在,且观察到N,概率为p(1-a);③B存在,且观察到Y,概率为(1-p)b;④B存在,且观察到N,概率为(1-p)(1-b)。
1701030027
1701030028
我们关心的问题是,观察到Y,而A存在的概率是多少?故注意力可只放在情况①和情况③,因为只有这两种情况观察到Y,两种情况概率加总为pa+(1-p)b,这正是Y被观察到的概率,即Prob(Y)=pa+(1-p)b。同样,pa是A存在且观察到Y的概率,即Prob(AY)=pa。令Prob(A|Y)表示观察到Y时A存在的概率,则应有:Prob(AY)=Prob(Y)×Prob(A|Y)。这个公式重新安排一下,有:
1701030029
1701030030
1701030031
1701030032
1701030033
上面这个公式被称为贝叶斯公式,它给出了观察到缺陷报告Y后对存在A(有遗传缺陷)的概率评估。读者可以把前面的数字例子,Prob(A)=0.01,Prob(Y|A)=a=0.99,Prob(A|Y)=b=0.01,代进去计算一下,不难得到Prob(A|Y)=0.5,与数字例子得到的结果是一样的。
1701030034
1701030035
1701030036
1701030037
1701030039
无知的博弈:有限信息下的生存智慧 与上帝博弈
1701030040
1701030041
单人决策问题,一般不认为是博弈问题。但是,博弈论对于考察单人面临的不确定决策问题也是适用的。我们可引入一个虚拟的参与人──上帝,他的策略空间就是随机试验的各种状态;然后假设参与人是跟上帝进行博弈。上帝对任何结果的偏好都是一样的,所以他事先随便选择了他的策略,但你并没有观察到上帝的选择。而你,则需要考虑如何才能更好地对付上帝,使自己的(预期)赢利达到最大。正所谓与天斗,其乐无穷。现在我们来看几个与上帝博弈的例子。
1701030042
1701030043
该不该改变最初的选择
1701030044
1701030045
下面要讲到的例子与美国20世纪70年代的一个电视节目有关,其中的概率计算曾困扰着成千上万的大众。在节目中,节目参与者将在三扇门之间选择其中一扇。这三扇门中有且仅有一扇门的后面放着奖品,另外两扇门则放着讽刺性礼品比如鸡崽(chicken)或者笨驴(donkey)[1]。当节目参与者选定一扇门之后,主持人就会打开另外两扇门中没有奖品的一扇。然后在剩下的两扇关闭的门中,主持人会问参与者要不要改变最初的选择。
1701030046
1701030047
这里的问题就是:参与人希望获得奖品,而不是获得讽刺性礼品,那么现在仍关闭的两扇门中,他应当坚持最初的选择呢?还是改变主意选择另外一扇门?
1701030048
1701030049
大多数人凭直觉认为,剩下的两扇门中,每扇门后有奖品或没有奖品的概率各占50%。因此,改变主意选择另外一扇门和坚持最初的选择不改变,预期的赢利是一样的。的确,这种思路看来是没有什么错。因为在做最初的选择时,选择“碰巧是”正确的概率为1/3;而一旦选择之后,剩下两扇门,参与者从主持人的行为中所能得到的信息就只是将信念修正为自己选择正确的概率为1/2,选择失误的概率也是1/2。此外没有任何其他的信息改善。因此,他坚持原来的选择似乎可以说得过去。
1701030050
1701030051
但是,上述看法并不符合真实的情况。真实的情况是,若参与者改变自己最初的选择,那么获得奖品的概率是2/3,若不改变最初的选择,则获得奖品的概率仅为1/3。他应该改变自己最初的选择。
1701030052
1701030053
奇怪的是,将这个结果告诉参与者后,他们还常常难以理解为什么会这样。一种比较浅显的解释是这样的:在最初的选择中,选择了错误门的概率是2/3。如果参与人一开始的确选择了错误的门,那么主持人随后必然打开空门,而没有被打开的那一扇就必然有奖品,此时参与人显然应该改变主意转换到自己没选择也没有被打开的那扇门。如果最初的选择中参与人的确选正确了(概率为1/3),那么他显然应该坚持,并因此获得奖品。也就是说,如果参与人一开始就选错了,则参与人应该换门并一定获得奖金,如果参与人一开始就选对了,则应该坚持并一定获得奖金──于是,转换门获得奖金的概率与不转换门获得奖金的概率实际上就是最初选择是正确和错误的概率。而一开始,选择错误的概率是2/3,正确的概率是1/3。因此,在不知自己选择是正是误的情况下,在第二阶段改变主意转换到另一扇门,的确增加了获得奖品的概率。
1701030054
1701030055
对于有些喜欢做实验的读者,如果你不明白上述道理,那么我建议你做这样一个游戏:准备三张扑克和一枚硬币,让你的朋友来当节目主持人将三张牌铺在桌面上(并将那枚硬币放在其中一张之下);然后你来选择一张牌;你的朋友从你没选取的牌中拿走没有硬币的一张,再问你是否改变你当初选的牌。为了证明转换选择比不转换选择更有可能获得奖品,你可以尝试以“转换选择”为策略进行数十次(比如50次)实验,再以“不转换选择”为策略进行同样多次数(比如50次)的实验。结果你会发现什么?你将发现“转换选择”的策略中得到硬币的次数基本上是“不转换选择”策略中得到硬币的次数的两倍,而这两种策略中硬币出现的频率也基本上分别接近2/3和1/3。
1701030056
1701030057
当然,在一次性节目中,并不允许这样的重复实验。而且大多数人的确也不明智地选择了“不转换选择”。我曾在学生中做过这个实验,结果32人中有20人坚持“不转换选择”。这说明大多数人不清楚这样复杂的概率思考。更有意思的是,我跟我太太玩这个游戏时,她也是坚持“不转换选择”。当我告诉她如果转换可以成倍提高获奖概率时,她却说:如果我开始选对了,转换后结果错了就会后悔,所以心理素质好的就不应该转换。当然,她说的已经不是纯粹的概率计算,但也不是没有道理的。人们的行为的确不仅受制于各种精心的算计,也往往受制于某些心理因素(比如后悔)。不过,我对她的答案疑问在于:“如果开始选择对了,那么后来转换了选择会令人后悔。但是,如果后来你知道开始的选择错了,而你又没有转换选择,你就不后悔没有转换吗?”太太的回答更经典:“一开始选择错了,我只认为是运气不好,没什么可后悔的;如果开始对了,后来转换错了,才是后悔的。”这让我立即想到人们日常生活中常提到的道理:从没得到的东西,也就不会有失去它的痛苦,而已经得到的失去了,就会深感创伤[2]。从太太的回答中,我突然明白了为什么行为博弈理论(behavioral game theory)现在大行其道。
1701030058
1701030059
从没得到的东西,也就不会有失去它的痛苦,而已经得到的失去了,就会深感创伤。
[
上一页 ]
[ :1.70103001e+09 ]
[
下一页 ]