打字猴:1.704420918e+09

1704420918 和在完全信息有限重复囚徒困境中最后一个阶段的情况相同，在这里的两阶段非完全信息博弈的第二阶段，坦白（F）也严格优于合作（C），这对理性的行参与者和列参与者是一样的。由于列参与者肯定在最后一个阶段选择坦白，对理性的行参与者来说，也没有任何理由在第一阶段选择合作。最后，投桃报李的战略使博弈始于相互合作，那么，需要确定的惟一行动便是列参与人第一阶段的行动（X），它将在第二阶段因投桃报李而被模仿，如图4.3.5所示。

1704420919

1704420920

1704420921

1704420922

1704420923 图4.3.5

1704420924

1704420925 通过选择X=C，列参与者在第一阶段得到期望收益p·1+（1-p）·b，且在第二阶段得到p·a。（由于投桃报李的和理性的行参与人在第一阶段选择的行动不同，列参与人在第二阶段开始时就会知道行参与人是投桃报李类型的还是理性的。第二阶段的期望收益p·a则反映了列参与人在决定第一阶段是合作还是坦白时对行参与人类型的不确定性。）通过选择X=F，与之相反，列参与人第一阶段获得p·a，并在第二阶段得到0。因此，下式成立时，列参与人将在第一阶段选择合作

1704420926

1704420927 p+（1-p）b≥0. （4.3.2）

1704420928

1704420929 在后面，我们假定（4.3.2）是成立的。

1704420930

1704420931 现在，考虑三阶段的情况。给定（4.3.2），如果列参与人和理性的行参与人都在第一阶段选择合作，则第二和第三阶段的均衡路径将由图4.3.5给出，只需令X=C并更改一下阶段的表示数字。我们将推导列参与人和理性的行参与人在第一阶段相互合作的充分条件，在此条件下三阶段的均衡路径如图4.3.6所示。

1704420932

1704420933 在这样的均衡中，理性行参与人的收益为1+a，列参与人的期望收益为l+p+（1-p）b+pa。如果理性的行参与人在第一阶段选择坦白，则行参与人是理性的就成为共同知识，于是在第二和第三阶段两参与者都选择坦白。那么，理性行参与人第一阶段选择坦白可得到的总收益为a，它要低于均衡收益1+a，于是理性行参与人没有动机去背离图4.3.6中隐含的战略。

1704420934

1704420935

1704420936

1704420937

1704420938 图4.3.6

1704420939

1704420940 下面，我们考虑列参与人是否有动机背离。如果列参与人在第一阶段就选择坦白，则投桃报李将在第二阶段选择坦白，理性的行参与人也将在第二阶段选择坦白，因为列参与人肯定会在最后阶段选择坦白。在第一阶段坦白之后，列参与人必须决定在第二阶段是合作还是继续坦白。如果列参与人在第二阶段也坦白，则投桃报李型在第三阶段将选择坦白，于是博弈的进行将如图4.3.7所示。列参与人从这种背离中得到的收益为a，它小于列参与人均衡的期望收益的条件为

1704420941

1704420942 1+p+（1-p）b+pa≥a.

1704420943

1704420944 给定（4.3.2），列参与人不选择这一背离战略的充分条件为

1704420945

1704420946 1+p·a≥a. （4.3.3）

1704420947

1704420948

1704420949

1704420950

1704420951 图4.3.7

1704420952

1704420953 另一种情况是，列参与人的背离战略可以是在第一阶段坦白，但在第二阶段合作，这时投桃报李将在第三阶段选择合作，于是博弈的进行如图4.3.8，列参与人这种背离战略的收益为a+b+p·a，它小于列参与人均衡期望收益的条件为

1704420954

1704420955 1+p（1-p）b+pa≥a+b+pa.

1704420956

1704420957 给定（4.3.2），列参与人不选择这一背离战略的充分条件为

1704420958

1704420959 a+b≤l. （4.3.4）

1704420960

1704420961

1704420962

1704420963

1704420964 图4.3.8

1704420965

1704420966 现在，我们已经证明如果（4.3.2）、（4.3.3）和（4.3.4）成立，则图4.3.6描述的博弈进行为三阶段囚徒困境博弈一个精炼贝叶斯均衡下的均衡路径。对一个给定的p值，如果收益a和b的值处于图4.3.9中的阴影部分，则满足这三个不等式。随p趋于0，这一阴影部分将会消失，这与前面的结论是一致的，即本节中我们分析短期博弈中的合作均衡，它要求足够大的p值，而KMRW则重点分析长期博弈且p值很小的情况。另一方面，如果p值大到足以支持短期博弈中的合作，它的值当然可以支持长期博弈中的合作。正式地，如果a、b和满足（4.3.2）、（4.3.3）及（4.3.4），则对任意有限的T＞3，在T阶段重复博弈中存在一个精炼贝叶斯均衡，其中理性的行参与人和列参与人直到T-2阶段之前都选择合作，在其后的T-1阶段和T阶段则如图4.3.5所示。参见附录4.3.C对这一结论的证明。

1704420967

[ 上一页 ] [ :1.704420918e+09 ] [ 下一页 ]