打字猴:1.701032532e+09

1701032532 譬如，在图A-7的博弈中，在信息集I2，参与人2并不知道自己处于哪个历史上，即他只知道参与人1选择加注，却不知1手中牌大牌小。在博弈开始的时候，大家对于运气的选择有一个初始信念（先验的信念），即运气以（0.5，0.5）的概率选择1的牌之大小。如果我们在博弈开始（乃至在1尚未选择行动的时候），我们询问参与人2：“你认为甲有多大可能性拿到的是大牌？”他的答案应是“0.5”。

1701032533

1701032534 现在，设若1已经选择了加注。我们再询问2：“你认为甲有多大可能性拿到的是大牌？”他的答案还是0.5吗？参与人2很可能会这样思考：如果1拿到大牌，而直接摊牌只能赢得1单位，如果加注则可能得到1单位或者2单位，因此1拿到大牌则必然加注；但是若1拿到小牌，直接摊牌将会输掉1单位，如果加注则可能得到1单位也可能失去2单位，因此他不能完全选择摊牌也不能完全选择加注，而只能部分地选择加注或摊牌；既然他拿到大牌必定加注，而拿到小牌则有时加注，显然我不能一看到他加注就认为大牌小牌的概率各占一半，加注的时候他多半拿了大牌，少半拿了小牌。

1701032535

1701032536 是的，参与人1的行动将改变参与人2的先验信念。但是2如何修正其信念呢？为了使2的信念修正能够得以完成，我们不妨假设出参与人1的行为策略（p，q），即在信息集I11参与人1以概率p选择加注（从而以1-p选择摊牌），在信息集I12参与人1以概率q选择加注（从而以1-q选择摊牌）。那么，我们容易推出：历史（大，加注），即信息集I2左边的结点，出现的概率是0.5p；历史（小，加注），即信息集I2右边的结点，出现的概率是0.5q。从而，根据本附录第一部分讲到的贝叶斯法则，可推断：

1701032537

1701032538

1701032539

1701032540

1701032541 这里Pr（大|I2）就是在信息集I2参与人2对参与人1拿到大牌的信念修正；Pr（小|I2）就是在信息集I2参与人2对参与人1拿到小牌的信念修正。

1701032542

1701032543 寻找均衡

1701032544

1701032545 不完美信息动态博弈所对应的均衡是（弱）序贯均衡。[3]（弱）序贯均衡成立的两个条件是：

1701032546

1701032547 ·参与人的策略是彼此的最优反应，即参与人策略是均衡的。在不完美信息动态博弈中，策略的均衡要求，从参与人的每一个信息集出发到终点的局部博弈中，参与人的策略都是对其他人策略的最优反应。这被总结为序贯理性（sequential retionality）条件。

1701032548

1701032549 ·给定参与人的信念体系，根据均衡策略调整的参与人信念是一致的。通俗地说，就是参与人会根据其他人的行动进行信念的更新（按照贝叶斯法则），均衡要求更新后的信念与其他人的行动仍是兼容的。这被总结为信念一致性条件。

1701032550

1701032551 回到A-7的例子中，我们可以这样分析该博弈的均衡：

1701032552

1701032553 假设参与人1采取行为策略（p，q），从而在信息集I2参与人2将信念修正为前面（*）式的情况，于是可计算2选择埋牌或开牌的预期收益：

1701032554

1701032555

1701032556

1701032557

1701032558 容易得到：

1701032559

1701032560 ·当p＞3q，E（埋牌）＞E（开牌），2选择埋牌。

1701032561

1701032562 ·当p＜3q，E（埋牌）＜E（开牌），2选择开牌。

1701032563

1701032564 ·当p=3q，E（埋牌）=E（开牌），2随机选择埋牌和开牌，不妨假设埋牌的概率为x，开牌的概率为1-x。

1701032565

1701032566 现在，已经获得了2在各种信念条件下的最优反应，再回头讨论各种条件下1的最优反应以及与2的信念一致性。

1701032567

1701032568 ·当p＞3q，2选择埋牌；给定2埋牌，则拿大牌的参与人1可随机选择摊牌或加注（因此p∈[0，1]），拿小牌的参与人1最好选择加注（因此q=1）。但是，当，p∈[0，1]，q=1不可能有p＞3q，信念产生冲突。此种条件不存在均衡。

1701032569

1701032570 ·当p＜3q，2选择开牌；给定2开牌，则拿大牌的参与人1最好始终选择加注（因此p=1）；拿小牌的参与人1最好选择摊牌（因此p=0）。但是，当p=1，q=0时，p＜3q得不到满足，信念冲突，均衡不成立。

1701032571

1701032572 ·当p=3q，2以概率（x，1-x）随机选择埋牌和开牌；给定2的策略，拿大牌的参与人1应始终选择加注（因为1＜1x+2（1-x）），即p=1；给定p=1，根据前提条件p=3q有q=1/3，即拿小牌的参与人1可以（1/3，2/3）概率选择加注和摊牌，这在信念上是一致的。而为了使拿小牌的参与人1这个行动是最优的，则需要2对于x的选择使拿小牌的参与人1在加注和摊牌之间的选择无差异，即：x（1）+（-2）（1-x）=-1，解出x=1/3。因此，此种情况下策略和信念都可达到均衡。我们可以说，图A-7翻牌博弈均衡是：1若拿大牌则始终加注，若拿小牌则以1/3的概率加注；2若观察到1加注，则以1/3的概率埋牌，以2/3的概率翻牌。

1701032573

1701032574 当然，对于均衡的求解也可以通过另外的方法进行。比如，我们既然定义出了1和2的策略，那么也就可以将博弈转化成策略式，图A-7博弈的策略式表达如图A-8。

1701032575

1701032576 可以发现，图A-8中没有纯策略均衡，但是存在混合策略均衡：参与人1以2/3的概率选择策略（加注，摊牌），以1/3的概率选择策略（加注，加注）；参与人2以1/3的概率选择埋牌，以2/3的概率选择开牌。这个混合策略结果与我们前面计算出来的行为策略结果是一样的。

1701032577

1701032578

1701032579

1701032580

1701032581 图A-8

[ 上一页 ] [ :1.701032532e+09 ] [ 下一页 ]