打字猴:1.70442025e+09

1704420250

1704420251 在第4.2节我们分析非完全信息条件下应用最广的博弈类型：信号博弈（signaling game）。用抽象的语言表述，信号博弈包含两个参与者（其中之一有私人信息，另一个没有），两步行动（首先由掌握私人信息的一方发出一个信号，然后没有私人信息的一方作出反应）。其主要思想是，如果某类有私人信息的参与者愿意发出一种信号，而另外类型的参与者因成本太高无法发出同样的信号，则交流就可达成。首先，我们定义信号博弈的精炼贝叶斯均衡，并描述可能存在的不同种类的均衡结果（分别对应于不同程度的交流，从没有交流到完美交流）。其后，考虑斯彭斯（Spence，1973）的极富创意的就业市场信号模型，以及迈尔斯和迈卢夫（Myers&Majluf，1984）的公司投资模型和维克斯（Vickers，1986）的货币政策模型。

1704420252

1704420253 在第4.3节我们讨论精炼贝叶斯均衡的其他应用。首先介绍克劳福德和索贝尔（1982）对空谈博弈（cheap-talk game）的分析（即所有的信号都不需任何成本的信号博弈），该模型的应用包括总统否决权威胁、联邦储备委员会关于货币政策的表态，以及组织内部的交流（或“声音”（voice））。在空谈博弈中，交流的程度决定于参与者利益在多大程度上是共同的，而不在于不同类型参与者发出信号的成本差异。其后我们研究索贝尔和高桥（1983）的序贯谈判模型，其中企业必须要承受一次罢工以表明它无法支付更高的工资（比较第2.1.D节中鲁宾斯坦的完全信息谈判模型，在均衡情况下不会出现罢工）。最后，我们将介绍克雷普斯、米尔格龙（Milgmm）、罗伯茨以及威尔逊（1982）等人十分重要的研究结论，他们分析了声誉（Reputation）在有限重复的囚徒困境中达成理性合作的关键作用（参照第2.3.A节得出的结论，阶段博弈有惟一纳什均衡的有限重复博弈，有惟一的子博弈精炼纳什均衡，即阶段博弈的纳什均衡重复n次）。

1704420254

1704420255 在第4.4节重回理论分析。尽管是本书的最后一节，但它更多地指示博弈论的发展方向及更新和更深入的研究领域，而不只是对以前内容的总结。我们介绍并举例说明两个（相互承继的）对精炼贝叶斯均衡的再精炼，其中第二个是赵和克雷普斯（Chao&Kreps，1987）的直观标准（Intuitive Criterion）。

1704420256

1704420257

1704420258

1704420259

1704420260 博弈论基础 [:1704417437]

1704420261 博弈论基础 4.1 精炼贝叶斯均衡概述

1704420262

1704420263 考虑如下完全非完美信息动态博弈。第一，参与者1在3个行动中进行选择——L、M及R。如果参与者1选择R，则博弈结束（不等参与者2行动）。如果参与者1选择了L或M，则参与者2就会知道1没有选择R（但不清楚1是选择了L还是M），并在或L’或R’两个行动中进行选择，博弈随之结束。收益情况由图4.1.1的扩展式博弈给出。

1704420264

1704420265

1704420266

1704420267

1704420268 图4.1.1

1704420269

1704420270

1704420271

1704420272

1704420273 图4.1.2

1704420274

1704420275 通过图4.1.2给出的这一博弈的标准式表述，我们可以发现存在两个纯战略纳什均衡（L，L’）和（R，R’）。为确定这些纳什均衡是否符合子博弈精炼的条件，我们先明确博弈的子博弈。由于子博弈根据定义始于单一信息集的决策节（但不包含博弈的第一个决策节），图4.1.1里的博弈不存在子博弈。如果一个博弈没有子博弈，则子博弈精炼的要求（具体地说，即参与者的战略在每一个子博弈中均构成纳什均衡）自然就得到满足。从而在任何没有子博弈的博弈中，子博弈精炼纳什均衡的定义便等同于纳什均衡的定义，于是在图4.1.1中，（L，L’）以及（R，R’）都是子博弈精炼纳什均衡。然而，（R，R’）却又明显要依赖于一个不可信的威胁：如果轮到参与者2行动，则选择L’要优于选择R’，于是参与者1便不会由于2威胁他将在其后的行动中选择R’，而去选择R。

1704420276

1704420277 使均衡概念得到进一步强化，以排除图4.1.1中像（R，R’）的子博弈精炼纳什均衡的方法之一，是再附加以下两个要求。

1704420278

1704420279 要求1：在每一信息集中，应该行动的参与者必须对博弈进行到该信息集中的哪个节有一个推断（belief）。对于非单节信息集，推断是在信息集中不同节点的一个概率分布；对于单节的信息集，参与者的推断就是到达此单一决策节的概率为1。

1704420280

1704420281 要求2：给定参与者的推断，参与者的战略必须满足序贯理性（sequentially rational）的要求。即在每一信息集中应该行动的参与者（以及参与者随后的战略），对于给定的该参与者在此信息集中的推断，以及其他参与者随后的战略（其中“随后的战略”是在达到给定的信息集之后，包括了其后可能发生的每一种情况的完全的行动计划）必须是最优反应。

1704420282

1704420283 在图4.1.1中，要求1意味着如果博弈的进行达到参与者2的非单节信息集，则参与者2必须对具体到达哪一个节（也就是参与者1选择了L还是R）有一个推断。这样的推断就表示为到达两个节的概率p和1-p见图4.1.3。

1704420284

1704420285

1704420286

1704420287

1704420288 图4.1.3

1704420289

1704420290 给定参与者2的推断，选择R’的期望收益就等于p·0+（1-p）·1=1-p，而选择L’的期望收益等于p·1+（1-p）·2=2-p。由于对任意的p，都有2-p＞1-p，要求2就排除了2选择R’的可能性，从而，在本例中简单要求每一参与者持有一个推断，并且在此推断下选择最优行动，就足以使我们排除不合理的均衡（R，R’）。

1704420291

1704420292 要求1和2只保证了参与者持有推断，并对给定的推断选择最优行动，但并没有明确这些推断是否是理性的。为进一步约束参与者的推断，我们需要区分处于均衡路径上的信息集和不处于均衡路径上的信息集。

1704420293

1704420294 定义对于一个给定的扩展式博弈中给定的均衡，如果博弈根据均衡战略进行时将以正的概率达到某信息集，我们称此信息集处于均衡路径之上（on the equilibrium path）。反之，如果博弈根据均衡战略进行时，肯定不会达到某信息集，我们称之为处于均衡路径之外的信息集（off the equilibrium path）。（其中“均衡”可以是纳什、子博弈精炼、贝叶斯以及精炼贝叶斯均衡）

1704420295

1704420296 要求3：在处于均衡路径之上的信息集中，推断由贝叶斯法则及参与者的均衡战略给出。

1704420297

1704420298 例如，在图4.1.3的子博弈精炼纳什均衡（L，L’）中，参与者2的推断一定是p=1：给定参与者1的均衡战略（具体地说，L），参与者2知道已经到达了信息集中的哪一个节。作为要求3的另一种说明（假定性的），设想在图4.1.3中存在一个混合战略均衡，其中参与者1选择L的概率为q1，M的概率为q2，选择R的概率为1-q1-q2。要求3则强制性规定参与者2的推断必须为p=q1/（q1+q2）。

1704420299

[ 上一页 ] [ :1.70442025e+09 ] [ 下一页 ]