打字猴:1.704420077e+09

1704420077

1704420078

1704420079

1704420080

1704420081 博弈论基础 [:1704417430]

1704420082 博弈论基础 3.3 显示原理（The Revelation Principle）

1704420083

1704420084 显示原理在贝叶斯博弈的条件下最先由迈尔森（1979）提出（其他相关条件下有不同学者也提出过类似的结果），是在参与者掌握私人信息时进行博弈设计的重要工具。它可应用于前两节讲过的拍卖及双边贸易问题，以及其他很多类似的问题。本节我们先给出并证明静态贝叶斯博弈的显示原理（将证明结果扩展到包含动态贝叶斯博弈十分简单）。不过，在这之前，我们简要介绍显示原理应用于拍卖及双边贸易问题中时所起的作用。

1704420085

1704420086 考虑卖方希望设计一个拍卖以使他的期望收入最大化，逐一列出卖方可能考虑的不同的拍卖方式是一项艰巨的工作，例如在第3.2.B节的拍卖中，出价最高的投标方付钱给卖方并得到商品，但还存在许多其他可能。如投标方可能还需要支付一定的进入费用，更为一般地，一些失败的投标方也不得不付出一些钱，其数量也许依赖于自己和其他人的投标价格。另外，卖方也可能会制定一个底价——低于此价格的投标价将不会被接受。其他情况还包括，物品可能会有一定的概率卖不出去，而物品的确卖出时，也不总是卖给出价最高的投标方。

1704420087

1704420088 这时卖方就可以借助于显示原理来使他的问题得到非常大的简化，这有两个方面。第一，卖方可以将其分析集中在以下类型的博弈：

1704420089

1704420090 1.投标方同时声明（也许是不诚实的）他们自己的类型（即他们各自的估价）。投标方i可以自称其类型为i的可行类型集Ti中的任意τi，而不论他的真实类型ti是什么。

1704420091

1704420092 2.在给定的投标方的声明（τ1，…τn）下，投标方i以q1（τ1，…，τn）的概率支付xi（τ1，…，τn）得到标的物品。对所有可能的声明组合（τ1，…，τn），概率q1（τ1，…，τn）+…+qn（τ1，…，τn）之和必须小于或等于1。

1704420093

1704420094 这种类型的博弈（即每一参与者惟一的行动就是宣布自己所属类型的静态贝叶斯博弈）称为直接机制（direct mechanism）。

1704420095

1704420096 第二，根据显示原理，卖方又可以把分析集中到这样的直接机制，其中每一投标方实话实说构成一个贝叶斯纳什均衡——也就是，设计适当的支付和概率函数{x1（τ1，…，τn），…，xn（τ1，…，τn）；q1（τ1，…，τn），…，qn（τ1，…，τn）}使得每一参与者i的均衡战略是宣布τi（ti）=ti，对每一Ti中的ti都是如此。实话实说形成贝叶斯纳什均衡的直接机制叫做激励相容（incentive-compatiable）。

1704420097

1704420098 在拍卖设计之外的其他问题上，显示原理同样可以用于这两个方面。任何贝叶斯博弈的任何贝叶斯纳什均衡都可以重新表示为经过适当设计的一个新的贝叶斯博弈的新的贝叶斯纳什均衡，这里的“重新表示”我们指对每一可能的参与者的类型组合（t1，…，tn），新的均衡下参与者的行动和收益与旧的均衡下完全相同。不论原博弈是什么样子，新的贝叶斯博弈总是一个直接机制。更为正式地：

1704420099

1704420100 定理（显示原理）任何贝叶斯博弈的任何贝叶斯纳什均衡，都可以重新表示为一个激励相容的直接机制。

1704420101

1704420102 在第3.2.B节分析的拍卖中，我们假定投标方的估价相互独立，同时还假定（暗含于对投标方估价的定义之中）知道投标方j的估价并不会改变投标方i的估价（尽管这往往会改变i的投标价格）。我们把这两个假定所表达的特点归纳为投标方的估价相互独立，并且是各自的私人信息。对这样的情况，迈尔森（1981）计算出了什么样的直接机制有实话实说的均衡，并且哪一个均衡可以使卖方的期望收益最大化。显示原理又保证了没有另外的拍卖机制，其贝叶斯纳什均衡可以使卖方得到更高的期望收益，因为这样的拍卖机制下这样的均衡已经被重新表示为一个直接机制中的一个实话实说均衡，并且所有这样的激励相容的直接机制都已考虑在内了。迈尔森同时还证明了第3.2.B节中分析的拍卖中对称贝叶斯纳什均衡就相当于这里的收益最大化实话实说均衡（正如许多其他常见拍卖博弈中的对称均衡一样）。

1704420103

1704420104 作为显示原理在拍卖中应用的第二个例子，考虑第3.2.C节描述的双边贸易问题，我们分析了买卖双方可能会选择进行的一种交易博弈——双向拍卖。在那里，如果交易发生，则买方会支付一些钱给卖方，而如果交易不能发生，则也没有支付，但同样还存在许多其他可能情况。比如，即使交易不发生，也可能会有支付（从买方向卖方，或者相反），或者交易发生的概率严格地在0和1之间（0、1间的开区间）；还有，决定交易是否发生的条件可能会要求买方的出价高出卖方要价特定幅度（正的或负的），而这一幅度甚至还可以依双方出价不同而变动。

1704420105

1704420106 我们可以通过以下类型的直接机制把所有这些可能性都考虑进去：买方和卖方同时就各自的类型作出声明，表示为τb和τs，之后买方支付给卖方x（τb，τs），既可以为正也可以为负，并以q（τb，τs）的概率获得物品。迈尔森和萨特思韦特推导出什么样的直接机制有实话实说均衡，并且提出了双方在每一种类型下愿意参加博弈的约束条件（即双方在每一种类型下均衡的期望收益不低于该种类型拒绝参加时可得到的收益——具体地说，拒绝参加时，买方的每一类型tb和卖方的每一类型ts的收益都为0）。最后，他们还证明所有激励相容的直接机制都不能达到交易当且仅当有效率时肯定发生的概率为1。从而显示原理也保证了不存在这样的双方都乐于参加的讨价还价博弈，在其贝叶斯纳什均衡中，当且仅当有效率时交易发生。

1704420107

1704420108 为给出显示原理的正式表述及其证明，在静态贝叶斯博弈G={A1，…，An；T1，…，Tn；p1，…，pn；u1，…，un}中，考虑贝叶斯纳什均衡s*=（s1*，…，sn*）。我们将构建一个有着实话实说均衡的直接机制来重新表示s*。符合条件的直接机制是一个静态贝叶斯博弈，和G有相同的类型空间和推断，但其行动空间和收益函数却不一样。新的行动空间非常简单，直接机制中参与者i的可行行动就是（可能是不诚实地）声明i的所属类型，这就是说，参与者i的行动空间为Ti。新的收益函数就复杂多了，它们不仅决定于原博弈G，还决定于原博弈的均衡s*。问题的关键在于运用G的均衡解s*来保证实话实说是直接机制的均衡解，具体证明步骤如下。

1704420109

1704420110

1704420111

1704420112

1704420113

1704420114

1704420115

1704420116 说s*是G的一个贝叶斯纳什均衡，意味着对每一参与者i，si*为i对其他参与者战略的最优反应。更为具体地，对i的每一种类型，都是i对给定其他参与者的战略为时，从Ai中选择的最优行动。那么，如果i的类型为ti，并且我们允许i从Ai中包含的一个子集中选择行动，仍然假定其他参与者的战略为，则i的最优选择仍为。选定直接机制中的收益函数时，就是设法使每一参与者面临和上面相同的选择。

1704420117

1704420118

1704420119 确定直接机制中收益函数的方法如下：首先将新博弈中参与者关于类型的声明τ=（τ1，…，τn）代入原博弈中的均衡战略s*，然后将求得的原博弈的均衡行动代入原博弈的收益函数。用公式表示，i的收益函数为

1704420120

1704420121 v*（τ，t）=ui[s*（τ），t]，

1704420122

1704420123 其中t=（t1，…，tn）。之所以会得到这样的收益函数，我们可以设想为一个局外人在各参与方之间进行联系，并作内容如下的谈话：

1704420124

1704420125

1704420126

[ 上一页 ] [ :1.704420077e+09 ] [ 下一页 ]