打字猴:1.701032532e+09
1701032532 譬如,在图A-7的博弈中,在信息集I2,参与人2并不知道自己处于哪个历史上,即他只知道参与人1选择加注,却不知1手中牌大牌小。在博弈开始的时候,大家对于运气的选择有一个初始信念(先验的信念),即运气以(0.5,0.5)的概率选择1的牌之大小。如果我们在博弈开始(乃至在1尚未选择行动的时候),我们询问参与人2:“你认为甲有多大可能性拿到的是大牌?”他的答案应是“0.5”。
1701032533
1701032534 现在,设若1已经选择了加注。我们再询问2:“你认为甲有多大可能性拿到的是大牌?”他的答案还是0.5吗?参与人2很可能会这样思考:如果1拿到大牌,而直接摊牌只能赢得1单位,如果加注则可能得到1单位或者2单位,因此1拿到大牌则必然加注;但是若1拿到小牌,直接摊牌将会输掉1单位,如果加注则可能得到1单位也可能失去2单位,因此他不能完全选择摊牌也不能完全选择加注,而只能部分地选择加注或摊牌;既然他拿到大牌必定加注,而拿到小牌则有时加注,显然我不能一看到他加注就认为大牌小牌的概率各占一半,加注的时候他多半拿了大牌,少半拿了小牌。
1701032535
1701032536 是的,参与人1的行动将改变参与人2的先验信念。但是2如何修正其信念呢?为了使2的信念修正能够得以完成,我们不妨假设出参与人1的行为策略(p,q),即在信息集I11参与人1以概率p选择加注(从而以1-p选择摊牌),在信息集I12参与人1以概率q选择加注(从而以1-q选择摊牌)。那么,我们容易推出:历史(大,加注),即信息集I2左边的结点,出现的概率是0.5p;历史(小,加注),即信息集I2右边的结点,出现的概率是0.5q。从而,根据本附录第一部分讲到的贝叶斯法则,可推断:
1701032537
1701032538
1701032539
1701032540
1701032541 这里Pr(大|I2)就是在信息集I2参与人2对参与人1拿到大牌的信念修正;Pr(小|I2)就是在信息集I2参与人2对参与人1拿到小牌的信念修正。
1701032542
1701032543 寻找均衡
1701032544
1701032545 不完美信息动态博弈所对应的均衡是(弱)序贯均衡。[3](弱)序贯均衡成立的两个条件是:
1701032546
1701032547 ·参与人的策略是彼此的最优反应,即参与人策略是均衡的。在不完美信息动态博弈中,策略的均衡要求,从参与人的每一个信息集出发到终点的局部博弈中,参与人的策略都是对其他人策略的最优反应。这被总结为序贯理性(sequential retionality)条件。
1701032548
1701032549 ·给定参与人的信念体系,根据均衡策略调整的参与人信念是一致的。通俗地说,就是参与人会根据其他人的行动进行信念的更新(按照贝叶斯法则),均衡要求更新后的信念与其他人的行动仍是兼容的。这被总结为信念一致性条件。
1701032550
1701032551 回到A-7的例子中,我们可以这样分析该博弈的均衡:
1701032552
1701032553 假设参与人1采取行为策略(p,q),从而在信息集I2参与人2将信念修正为前面(*)式的情况,于是可计算2选择埋牌或开牌的预期收益:
1701032554
1701032555
1701032556
1701032557
1701032558 容易得到:
1701032559
1701032560 ·当p>3q,E(埋牌)>E(开牌),2选择埋牌。
1701032561
1701032562 ·当p<3q,E(埋牌)<E(开牌),2选择开牌。
1701032563
1701032564 ·当p=3q,E(埋牌)=E(开牌),2随机选择埋牌和开牌,不妨假设埋牌的概率为x,开牌的概率为1-x。
1701032565
1701032566 现在,已经获得了2在各种信念条件下的最优反应,再回头讨论各种条件下1的最优反应以及与2的信念一致性。
1701032567
1701032568 ·当p>3q,2选择埋牌;给定2埋牌,则拿大牌的参与人1可随机选择摊牌或加注(因此p∈[0,1]),拿小牌的参与人1最好选择加注(因此q=1)。但是,当,p∈[0,1],q=1不可能有p>3q,信念产生冲突。此种条件不存在均衡。
1701032569
1701032570 ·当p<3q,2选择开牌;给定2开牌,则拿大牌的参与人1最好始终选择加注(因此p=1);拿小牌的参与人1最好选择摊牌(因此p=0)。但是,当p=1,q=0时,p<3q得不到满足,信念冲突,均衡不成立。
1701032571
1701032572 ·当p=3q,2以概率(x,1-x)随机选择埋牌和开牌;给定2的策略,拿大牌的参与人1应始终选择加注(因为1<1x+2(1-x)),即p=1;给定p=1,根据前提条件p=3q有q=1/3,即拿小牌的参与人1可以(1/3,2/3)概率选择加注和摊牌,这在信念上是一致的。而为了使拿小牌的参与人1这个行动是最优的,则需要2对于x的选择使拿小牌的参与人1在加注和摊牌之间的选择无差异,即:x(1)+(-2)(1-x)=-1,解出x=1/3。因此,此种情况下策略和信念都可达到均衡。我们可以说,图A-7翻牌博弈均衡是:1若拿大牌则始终加注,若拿小牌则以1/3的概率加注;2若观察到1加注,则以1/3的概率埋牌,以2/3的概率翻牌。
1701032573
1701032574 当然,对于均衡的求解也可以通过另外的方法进行。比如,我们既然定义出了1和2的策略,那么也就可以将博弈转化成策略式,图A-7博弈的策略式表达如图A-8。
1701032575
1701032576 可以发现,图A-8中没有纯策略均衡,但是存在混合策略均衡:参与人1以2/3的概率选择策略(加注,摊牌),以1/3的概率选择策略(加注,加注);参与人2以1/3的概率选择埋牌,以2/3的概率选择开牌。这个混合策略结果与我们前面计算出来的行为策略结果是一样的。
1701032577
1701032578
1701032579
1701032580
1701032581 图A-8
[ 上一页 ]  [ :1.701032532e+09 ]  [ 下一页 ]