打字猴:1.704421e+09

1704421000

1704421001 在第4.1节我们定义了精炼贝叶斯均衡为满足要求1到4的战略和推断，并已知在这样的均衡中，没有参与者的战略包含始于任何信息集的严格劣战略。现在，我们考虑两个更进一步的要求（关于处于均衡路径之外的推断）。第一条的形成出自以下想法：由于精炼贝叶斯均衡排除了参与者i选择的战略包含始于任何信息集的严格劣战略的可能性，要令参与者j相信参与者i将选择这样的战略就是不合理的。

1704421002

1704421003 为对这一思想的理解更为精确，考虑图4.4.1中的博弈，其中有两个纯战略精炼贝叶斯均衡：（L，L’，p=1）和（R，R’，p≤l/2）。[9]这一例子关键的特征在于M为参与者1的一个严格劣战略：选择R可得的收益2超出了参与者1选择M可能得到的所有收益——0和1。那么，要令参与者2相信1可能选择了M是不合理的；正式地，1-p不可能为正，于是p一定等于1。如果推断1-p＞0不合理，则（R，R’，p≤1/2）也不再是精炼贝叶斯均衡，只有（L，L’p=1）成为满足这一要求的惟一的精炼贝叶斯均衡。

1704421004

1704421005

1704421006

1704421007

1704421008 图4.4.1

1704421009

1704421010 这一例子的另外两个特征也值得简要提及。第一，尽管M是严格劣战略，L却不是。如果L也是严格劣战略（比如说1的收益3换成3/2时的情况），则同样的论证意味着p不可能为正，但这又与前面的结果p一定等于1相矛盾。在这样的情况下，这一要求不限制参与者2均衡路径之外的推断；见下文的正式定义。

1704421011

1704421012 第二，这一例子并不是对开始时描述的要求的精确说明，因为M并非只从一个信息集开始成为严格劣战略，而是其本身就是一个严格劣战略。为理解其中的区别，回顾第1.1.B节对严格劣战略的定义：如果存在另外一个战略使对其他参与者每一可能的战略组合，i选择si的收益都严格大于选择s’i的收益，则s’i为i的一个严格劣战略。现在，考虑图4.4.1中博弈的一种扩展情况，其中参与者2在图中1的行动之前有一次行动，并在这最初行动中有两个选择，一个使博弈结束，另一个轮到1在图中1的信息集选择行动。在这一扩展的博弈中，M仍从1的信息集开始成为一个严格劣战略，但M不再是整个博弈的严格劣战略，因为如果2在初始节选择的行动使博弈结束，则L，M和R全都只能得到相同的收益。

1704421013

1704421014 由于在图4.4.1中M为严格劣战略，令参与者2推断1可能已经选择了M当然是不合理的。但严格劣战略这一条件过强，并由此得到的要求又太弱。（因为从一个信息集开始成为严格劣战略的战略要多于整个博弈的严格劣战略，要求j不相信i会选择前一种战略对j推断的限制，要强于要求j不相信i会选择后一种战略对其推断的限制。）在下面，我们仍使用开始时给出的要求：参与者j不相信参与者i会选择从任何信息集成为严格劣战略的战略。下面我们给出这一要求的正式表述。

1704421015

1704421016 定义考虑轮到参与者i行动的一个信息集。战略s’i为始于这一信息集的严格劣战略（strictly dominated beginning at this information set），如果存在另一个战略si使得对i在给定信息集可能持有的每一推断，并且对每一其他参与者后续战略可能的组合（这里的“ 后续战略 ”（subsequent strategy），是一个包含了在达到给定信息集之后可能会发生的所有情况的完整的行动计划），i在给定信息集根据si选择行动并在其后根据选择后续战略得到的收益严格大于根据s’i选择行动和后续战略得到的收益。

1704421017

1704421018 要求5：在可能的情况下，在每一参与者均衡路径之外的推断中，如果一个节点只有在另一参与者选择始于某些信息集的严格劣战略时，才能够到达，则应认定到达这一节点的概率为0。

1704421019

1704421020 要求5中的限定语“在可能的情况下”，是考虑到类似图4.4.1中参与者1的收益3换成3/2的情况，这时M和L都劣于R。在这种情况下，要求1要求参与者2持有一个推断，但又不可能在推断中令到达M和L之下的节点的概率都为0，于是要求5不再适用。

1704421021

1704421022 作为对要求5的第二个说明，考虑图4.4.2的信号博弈。与第4.2.A节相同，发送者战略（m’，m”）表示类型t1选择信号m’，且类型t2选择信号m”；接收者战略（a’，a”）表示接收者在L之后选择行动a’，在R之后选择行动a”。我们可以很容易地检验对q≥1/2，战略和推断[（L，L），（u，d），p=0.5，q]构成博弈的一个混同精炼贝叶斯均衡。不过，这一信号博弈的关键特征，是令t1选择R没有任何意义。正式地，发送者战略（R，L）和（R，R）——亦即t1选择R的所有战略——为始于发送者对应于类型t1的信息集的严格劣战略。[10]那么，只有在发送者选择了始于一个信息集的严格劣战略时，才可能到达R之后接收者的信息集中节点t2。而且，存在另外一个始于任何信息集的非劣战略——即（L，R），可以在R之后接收者的信息集中到达节点t2。从而要求5限定q=0。因为只有在q≥1/2时，[（L，L），（u，d），p=0.5，q]为博弈的精炼贝叶斯均衡，此均衡不能满足要求5。

1704421023

1704421024

1704421025

1704421026

1704421027 图4.4.2

1704421028

1704421029 可以针对第4.2.A节定义的信号博弈精炼贝叶斯均衡，将要求5重新表述如下。

1704421030

1704421031 定义在信号博弈中，M中的信号mj称为T中类型tj的劣信号（dominated for type ti），如果存在另外一个信号mj，使得ti选择mj的最低可能收益大于ti选择mj的最高可能收益：

1704421032

1704421033

1704421034

1704421035

1704421036 信号要求5 如果mj之后的信息集处于均衡路径之外，且mj为类型ti的劣信号，则（在可能的情况下）接收者的推断μ（ti|mj）中，认为发送者的类型为ti的概率应该等于0（只要mj不对T中所有的类型都是劣信号，即为适用这一要求的可能情况）。

1704421037

1704421038 在图4.4.2的博弈中，分离精炼贝叶斯均衡[（L，R），（u，u），p=1，q=0]则自然满足信号要求5（因为不存在这一均衡路径之外的信息集）。作为一个需经检验才可确定满足信号要求5的例子，假设当类型t2选择R时，接收者的收益为：选择d的收益为1，选择u的收益为0，而不再是图中的0和1。这时，[（L，L），（u，d），p=0.5，q]对任意的q值都是一个混同精炼贝叶斯均衡，于是[（L，L），（u，d），p=0.5，q=0]就是一个满足信号要求5的混同精炼贝叶斯均衡。

1704421039

1704421040 在有些博弈中，存在看起来不合情理然而却满足要求5的精炼贝叶斯均衡。博弈论的最新研究中，最为活跃的领域之一便涉及到如下两个相关问题：（i）在什么情况下，一个精炼贝叶斯均衡是不合理的；（ii）在对均衡的定义中还能够再加上哪些要求，以剔除这些不合理的精炼贝叶斯均衡。赵和克雷普斯（1987）在这一领域的研究中作出了早期开创性的并有广泛影响的贡献。在本节的最后，我们讨论他们论文中三个方面的问题：（1）“啤酒或热狗”（Beer&Quiche）信号博弈，它说明了明显不合理的精炼贝叶斯均衡也可以满足信号要求5；（2）对信号要求5的一个强化要求（但绝非可能的最强条件的要求），称为直观标准（3）直观标准在斯彭斯的就业市场信号博弈中的应用。

1704421041

1704421042 在“啤酒或热狗”信号博弈中，发送者有两种可能的类型t1=软弱型（wimpy）（以0.1的概率），t2=粗暴型（surly）（以0.9的概率）。发送者的信号是早餐选择啤酒还是热狗；接收者的行动是决定是否与发送者挑起冲突。各方收益情况表现出如下特征：软弱类型偏好选择热狗作早餐，粗暴类型偏好啤酒，两种类型都不愿意同接收者相冲突（并与早餐吃什么相比，更关心这一点）；接收者则偏好与软弱类型挑起冲突，但不希望与粗暴类型挑起冲突（可以看出，如果将这一博弈中类型、信号和行动的名称稍作更换，就可以成为进入壁垒模型，与在米尔格龙和罗伯茨（1982）中的分析相似）。在图4.4.3的扩展式表述中，享用自己所偏好的早餐给两种类型带来的收益都是1，而避免冲突给两种类型带来的额外收益为2。接收者通过与软弱类型（粗暴类型）冲突获得的收益分别为1（-1）；所有其他情况的收益为0。

1704421043

1704421044

1704421045

1704421046

1704421047 图4.4.3

1704421048

1704421049 在这一博弈中，[（热狗，热狗），（不冲突，冲突），p=0.1，q]对任意q≥1/2构成一个混同精炼贝叶斯均衡。而且这一均衡满足信号要求5，因为啤酒对两种类型的发送者都不是劣信号。具体地说，软弱类型并不能保证选择热狗（最低的收益为1）一定比选择啤酒（最高收益为2）要好。但另一方面，接收者均衡路径之外的推断的确令人可疑：如果接收者意料之外地观测到啤酒，则他推测发送者与粗暴型至少有同样的可能性是软弱型（即q≥1/2），即使（a）软弱型选择啤酒并不能提高他选择热狗时的均衡收益；（b）粗暴型可能将其收益从均衡条件的2提高到3，只要接收者持有的推断q＜1/2。给定（a）和（b），可以期望粗暴类型在选择啤酒之后作出如下表白：

[ 上一页 ] [ :1.704421e+09 ] [ 下一页 ]