1704420930
1704420931
现在,考虑三阶段的情况。给定(4.3.2),如果列参与人和理性的行参与人都在第一阶段选择合作,则第二和第三阶段的均衡路径将由图4.3.5给出,只需令X=C并更改一下阶段的表示数字。我们将推导列参与人和理性的行参与人在第一阶段相互合作的充分条件,在此条件下三阶段的均衡路径如图4.3.6所示。
1704420932
1704420933
在这样的均衡中,理性行参与人的收益为1+a,列参与人的期望收益为l+p+(1-p)b+pa。如果理性的行参与人在第一阶段选择坦白,则行参与人是理性的就成为共同知识,于是在第二和第三阶段两参与者都选择坦白。那么,理性行参与人第一阶段选择坦白可得到的总收益为a,它要低于均衡收益1+a,于是理性行参与人没有动机去背离图4.3.6中隐含的战略。
1704420934
1704420935
1704420936
1704420937
1704420938
图4.3.6
1704420939
1704420940
下面,我们考虑列参与人是否有动机背离。如果列参与人在第一阶段就选择坦白,则投桃报李将在第二阶段选择坦白,理性的行参与人也将在第二阶段选择坦白,因为列参与人肯定会在最后阶段选择坦白。在第一阶段坦白之后,列参与人必须决定在第二阶段是合作还是继续坦白。如果列参与人在第二阶段也坦白,则投桃报李型在第三阶段将选择坦白,于是博弈的进行将如图4.3.7所示。列参与人从这种背离中得到的收益为a,它小于列参与人均衡的期望收益的条件为
1704420941
1704420942
1+p+(1-p)b+pa≥a.
1704420943
1704420944
给定(4.3.2),列参与人不选择这一背离战略的充分条件为
1704420945
1704420946
1+p·a≥a. (4.3.3)
1704420947
1704420948
1704420949
1704420950
1704420951
图4.3.7
1704420952
1704420953
另一种情况是,列参与人的背离战略可以是在第一阶段坦白,但在第二阶段合作,这时投桃报李将在第三阶段选择合作,于是博弈的进行如图4.3.8,列参与人这种背离战略的收益为a+b+p·a,它小于列参与人均衡期望收益的条件为
1704420954
1704420955
1+p(1-p)b+pa≥a+b+pa.
1704420956
1704420957
给定(4.3.2),列参与人不选择这一背离战略的充分条件为
1704420958
1704420959
a+b≤l. (4.3.4)
1704420960
1704420961
1704420962
1704420963
1704420964
图4.3.8
1704420965
1704420966
现在,我们已经证明如果(4.3.2)、(4.3.3)和(4.3.4)成立,则图4.3.6描述的博弈进行为三阶段囚徒困境博弈一个精炼贝叶斯均衡下的均衡路径。对一个给定的p值,如果收益a和b的值处于图4.3.9中的阴影部分,则满足这三个不等式。随p趋于0,这一阴影部分将会消失,这与前面的结论是一致的,即本节中我们分析短期博弈中的合作均衡,它要求足够大的p值,而KMRW则重点分析长期博弈且p值很小的情况。另一方面,如果p值大到足以支持短期博弈中的合作,它的值当然可以支持长期博弈中的合作。正式地,如果a、b和满足(4.3.2)、(4.3.3)及(4.3.4),则对任意有限的T>3,在T阶段重复博弈中存在一个精炼贝叶斯均衡,其中理性的行参与人和列参与人直到T-2阶段之前都选择合作,在其后的T-1阶段和T阶段则如图4.3.5所示。参见附录4.3.C对这一结论的证明。
1704420967
1704420968
1704420969
1704420970
1704420971
图4.3.9
1704420972
1704420973
附录4.3.C
1704420974
1704420975
为使叙述简洁,我们以合作均衡(cooperative equilibrium)表示T期重复囚徒困境中如下的精炼贝叶斯均衡,即理性的行参与人和列参与人从博弈开始直至T-2期全部选择合作,并在其后的T-1期和T期遵循图4.3.5所示的路径。我们将证明,如果a、b和p满足(4.3.2)、(4.3.3)和(4.3.4),则对所有的T>3都存在一个合作均衡。证明使用数学归纳法:如果对每一个τ=2,3,…,T-1,在τ期博弈中都存在合作均衡,则在T期博弈中存在合作均衡。
1704420976
1704420977
首先,我们证明在T期博弈中理性的行参与人没有动机背离合作均衡。如果行参与人在t<T-1中的任一阶段选择坦白,他是理性的就成为共识,于是行参与人在t期得到的收益为a,其后每一期的收益都为0。但行参与人的均衡收益为从t到T-2期每一期都等于1,T-1期的收益为a,共为(T-t-1)+a,于是对任意的t<T-1,坦白都无利可图。图4.3.5中的论证同时表明理性的行参与人在T-1期及T期也没有动机背离。
1704420978
1704420979
其次,我们证明列参与人没有动机背离。关于图4.3.5的论证表明,列参与人没有动机背离合作均衡战略,而在T-2期之前选择合作,并在T-1期选择坦白;关于图4.3.6的论证表明,列参与人没有动机选择如下的背离战略:从开始直到T-3期一直合作,并在T-2期坦白。从而,我们尚需证明列参与人没有动机选择下面的背离战略:从开始直到t-1期一直合作,而在t期坦白,这里的1≤t≤T-3。
[
上一页 ]
[ :1.70442093e+09 ]
[
下一页 ]