打字猴:1.70442098e+09

1704420980

1704420981 如果列参与人在t期坦白，投桃报李就将在t+1期坦白，而理性的行参与人也将在t+1期选择坦白（因为在t+1期的阶段博弈中，坦白严格优于合作，在其后从t+2到T期至少可以得到0的收益，而在t+1期合作将使得行参与人是理性的成为共同知识，使t+2到T期的收益只能等于0）。由于投桃报李与理性行参与人在t期之前全都选择合作，并都在t+1期坦白，列参与人在t+2期开始时的推断仍为行参与人是投桃报李类的概率为p。因此，如果列参与人在t+1期合作，则从t+2期开始的后一部分的博弈等同于τ=T-（t+2）+1时的τ期博弈。根据归纳法的假定，在这后一部分的τ期博弈中存在一个合作均衡，假定博弈按此均衡进行。则列参与人通过在t期坦白，而在t+1期合作，从t到T共可得到收益

1704420982

1704420983 a+b+[T-（t+2）-l]+p+（l-p）b+pa.

1704420984

1704420985 它小于列参与人从t到T期的均衡收益

1704420986

1704420987 2+[T-（t+2）-l]+p+（l-p）b+pa. （4.3.5）

1704420988

1704420989 至此，我们已证明列参与人没有动机背离均衡，而从开始到t-1期合作，在t期坦白，并在t+1期继续合作，其前提是在从t+2期开始的以后部分的博弈按合作均衡进行。更为一般的，列参与人也可以从开始直至t-1期合作，从t到t+s期坦白，并在t+s+1期合作。先需考虑三种特殊的情况：（1）如果t+s=T（即列参与人自从t期坦白后再不合作），则列参与人在t期收益为a，并在以后收益为0。等同于（4.3.5）；（2）如果t+s+1=T，则列参与人从t期到T期的收益为a+b，甚至更低于情况（1）；（3）如果t+s+1=T-1，则列参与人从t到T期的收益为a+b+pa，小于（4.3.5）。余下的就是要分析t+s+1＜T-1的情况。和上面s=0的情况相同，在从t+s+2期开始的以后部分博弈中存在一个合作均衡，假定博弈按此合作均衡进行。则列参与人选择这一背离战略从t到T期得到的收益为

1704420990

1704420991 a+b+[T-（t+s+2）-1]+p+（l-p）b+pa

1704420992

1704420993 同样小于（4.3.5）。

1704420994

1704420995

1704420996

1704420997

1704420998 博弈论基础 [:1704417447]

1704420999 博弈论基础 4.4 精炼贝叶斯均衡的再精炼

1704421000

1704421001 在第4.1节我们定义了精炼贝叶斯均衡为满足要求1到4的战略和推断，并已知在这样的均衡中，没有参与者的战略包含始于任何信息集的严格劣战略。现在，我们考虑两个更进一步的要求（关于处于均衡路径之外的推断）。第一条的形成出自以下想法：由于精炼贝叶斯均衡排除了参与者i选择的战略包含始于任何信息集的严格劣战略的可能性，要令参与者j相信参与者i将选择这样的战略就是不合理的。

1704421002

1704421003 为对这一思想的理解更为精确，考虑图4.4.1中的博弈，其中有两个纯战略精炼贝叶斯均衡：（L，L’，p=1）和（R，R’，p≤l/2）。[9]这一例子关键的特征在于M为参与者1的一个严格劣战略：选择R可得的收益2超出了参与者1选择M可能得到的所有收益——0和1。那么，要令参与者2相信1可能选择了M是不合理的；正式地，1-p不可能为正，于是p一定等于1。如果推断1-p＞0不合理，则（R，R’，p≤1/2）也不再是精炼贝叶斯均衡，只有（L，L’p=1）成为满足这一要求的惟一的精炼贝叶斯均衡。

1704421004

1704421005

1704421006

1704421007

1704421008 图4.4.1

1704421009

1704421010 这一例子的另外两个特征也值得简要提及。第一，尽管M是严格劣战略，L却不是。如果L也是严格劣战略（比如说1的收益3换成3/2时的情况），则同样的论证意味着p不可能为正，但这又与前面的结果p一定等于1相矛盾。在这样的情况下，这一要求不限制参与者2均衡路径之外的推断；见下文的正式定义。

1704421011

1704421012 第二，这一例子并不是对开始时描述的要求的精确说明，因为M并非只从一个信息集开始成为严格劣战略，而是其本身就是一个严格劣战略。为理解其中的区别，回顾第1.1.B节对严格劣战略的定义：如果存在另外一个战略使对其他参与者每一可能的战略组合，i选择si的收益都严格大于选择s’i的收益，则s’i为i的一个严格劣战略。现在，考虑图4.4.1中博弈的一种扩展情况，其中参与者2在图中1的行动之前有一次行动，并在这最初行动中有两个选择，一个使博弈结束，另一个轮到1在图中1的信息集选择行动。在这一扩展的博弈中，M仍从1的信息集开始成为一个严格劣战略，但M不再是整个博弈的严格劣战略，因为如果2在初始节选择的行动使博弈结束，则L，M和R全都只能得到相同的收益。

1704421013

1704421014 由于在图4.4.1中M为严格劣战略，令参与者2推断1可能已经选择了M当然是不合理的。但严格劣战略这一条件过强，并由此得到的要求又太弱。（因为从一个信息集开始成为严格劣战略的战略要多于整个博弈的严格劣战略，要求j不相信i会选择前一种战略对j推断的限制，要强于要求j不相信i会选择后一种战略对其推断的限制。）在下面，我们仍使用开始时给出的要求：参与者j不相信参与者i会选择从任何信息集成为严格劣战略的战略。下面我们给出这一要求的正式表述。

1704421015

1704421016 定义考虑轮到参与者i行动的一个信息集。战略s’i为始于这一信息集的严格劣战略（strictly dominated beginning at this information set），如果存在另一个战略si使得对i在给定信息集可能持有的每一推断，并且对每一其他参与者后续战略可能的组合（这里的“ 后续战略 ”（subsequent strategy），是一个包含了在达到给定信息集之后可能会发生的所有情况的完整的行动计划），i在给定信息集根据si选择行动并在其后根据选择后续战略得到的收益严格大于根据s’i选择行动和后续战略得到的收益。

1704421017

1704421018 要求5：在可能的情况下，在每一参与者均衡路径之外的推断中，如果一个节点只有在另一参与者选择始于某些信息集的严格劣战略时，才能够到达，则应认定到达这一节点的概率为0。

1704421019

1704421020 要求5中的限定语“在可能的情况下”，是考虑到类似图4.4.1中参与者1的收益3换成3/2的情况，这时M和L都劣于R。在这种情况下，要求1要求参与者2持有一个推断，但又不可能在推断中令到达M和L之下的节点的概率都为0，于是要求5不再适用。

1704421021

1704421022 作为对要求5的第二个说明，考虑图4.4.2的信号博弈。与第4.2.A节相同，发送者战略（m’，m”）表示类型t1选择信号m’，且类型t2选择信号m”；接收者战略（a’，a”）表示接收者在L之后选择行动a’，在R之后选择行动a”。我们可以很容易地检验对q≥1/2，战略和推断[（L，L），（u，d），p=0.5，q]构成博弈的一个混同精炼贝叶斯均衡。不过，这一信号博弈的关键特征，是令t1选择R没有任何意义。正式地，发送者战略（R，L）和（R，R）——亦即t1选择R的所有战略——为始于发送者对应于类型t1的信息集的严格劣战略。[10]那么，只有在发送者选择了始于一个信息集的严格劣战略时，才可能到达R之后接收者的信息集中节点t2。而且，存在另外一个始于任何信息集的非劣战略——即（L，R），可以在R之后接收者的信息集中到达节点t2。从而要求5限定q=0。因为只有在q≥1/2时，[（L，L），（u，d），p=0.5，q]为博弈的精炼贝叶斯均衡，此均衡不能满足要求5。

1704421023

1704421024

1704421025

1704421026

1704421027 图4.4.2

1704421028

1704421029 可以针对第4.2.A节定义的信号博弈精炼贝叶斯均衡，将要求5重新表述如下。

[ 上一页 ] [ :1.70442098e+09 ] [ 下一页 ]