打字猴:1.704419802e+09

1704419802

1704419803 现在，我们要建立非完全信息同时行动博弈的标准式表述，也称为静态贝叶斯博弈。首先要表示出非完全信息的关键因素，即每一参与者知道他自己的收益函数，但也许不能确知其他参与者的收益函数。令参与者i可能的收益函数表示为ui（a1，…，an；ti），其中ti称为参与者i的类型（type），它属于一个可能的类型集（亦称为类型空间（type space））Ti，每一类型ti都对应着参与者i不同的收益函数的可能情况。

1704419804

1704419805 举一个抽象的例子。假设参与者i有两种可能的收益函数，我们也可以说参与者i有两种类型，ti和t2参与者i的类型空间为Ti={ti1，ti2}并且参与者i的两种收益函数分别为ui（a1，…，an；ti1）和（ui（a1，…，an；ti2）。我们可以用参与者的每一类型都对应着该参与者不同收益函数的可能情况这一思路，来表示参与者有不同可行行动集时的情况，具体方法如下。例如，假设参与者i的可行行动集是{a，b}的概率为q，是{a，b，c}的概率为1-q，于是我们可以说i有两种类型（ti1和其中ti1的概率为q），并且对两种类型我们都可以认为其可行的行动集是{a，b，c}，只是对类型ti1定义其选择行动c的收益为-∞。

1704419806

1704419807 作为更为具体的例子，考虑前一节里的古诺博弈。企业的行动是它们的产量选择q1和q2。企业2有两种可能的成本函数，从而有两种可能的利润或收益函数：

1704419808

1704419809 π2（q1，q2；cL）=[（a-q1-q2）-cL]q2

1704419810

1704419811 和

1704419812

1704419813 π2（q1，q2；cH）=[（a-q1-q2）-cH]q2.

1704419814

1704419815 企业1只有一种可能的收益函数：

1704419816

1704419817 π1（q1，q2；c）=[（a-q1-q2）-c]q1.

1704419818

1704419819 我们说企业2的类型空间为T2={cL，cH}，企业1的类型空间为Ti={c}。

1704419820

1704419821 在这样定义参与者的类型之后，说参与者i知道自己的收益函数也就等同于说参与者i知道自己的类型，类似地，说参与者i可能不确定其他参与者的收益函数，也就等同于说参与者i不能确定其他参与者的类型，我们用t-i={t1，…，ti-l，ti+l，…，tn}表示。并用T-i表示t-i所有可能的值的集合，用概率pi（t-i|ti）表示参与者在知道自己的类型是ti的前提下，对其他参与者类型（即t-i）的推断（belief）。在第3.2节分析的所有应用中（以及绝大多数文献中），参与者之间的类型是相互独立的，这种情况下pi（t-i|ti）与ti不相关，于是我们可以把参与者的推断写成P1，…Pn。但是也存在参与者之间类型相关的情况，所以在给定静态贝叶斯博弈的定义时，我们考虑到这种情况，仍把参与者的推断写为pi（t-i|ti）。[1]

1704419822

1704419823 在我们已熟悉的完全静态贝叶斯博弈的标准式表述中加上类型和推断这两个新概念，就可得到静态贝叶斯博弈的标准式表述。

1704419824

1704419825 定义一个n人静态贝叶斯博弈的标准式表述包括：参与者的行动空间A1，…，An，它们的类型空间T1，…，Tn，他们的推断p1，…pn以及他们的收益函数u1，…un。参与者i的类型作为参与者i的私人信息，决定了参与者i的收益函数，ui（a1，…an；ti）并且是可能的类型集Ti中的一个元素。参与者i的推断pi（t-i|ti）描述了i在给定自己的类型ti时，对其他n-1个参与者可能的类型t-i，的不确定性。我们用G={A1，…，An；T1，…，Tn；p1，…，pn；u1，…，un}表示这一博弈。

1704419826

1704419827 根据豪尔绍尼（1967）的假定，静态贝叶斯博弈的时间顺序如下：（1）自然赋予博弈各方的类型向量t=（t1，…，tn），其中ti属于可行集合Ti；（2）自然告知参与者i自己的类型ti，却不告诉其他参与者的类型；（3）参与者同时选择行动，每一参与者i从可行集Ai中选择ai；（4）各方得到收益ui（ai，…，an；ti）。借助于第一步和第二步中虚构的参与者“自然”的行动，我们可以把一个非完全信息的博弈表述为一个非完美信息的博弈，其中非完美信息的含义（参见第2章）为在博弈的某些行动中，行动方不知道这以前的博弈进行的整个过程。这里，因为在第二步自然告知了参与者i自己的类型，却没有告知参与者j，在第三阶段参与者j选择行动时，j就不知道整个的博弈进行过程。

1704419828

1704419829 在讨论静态贝叶斯博弈的标准式表述的最后，还要提到两个技术性较强的问题。第一，在有的博弈中，参与者i不仅对他自己的收益函数掌握私人信息，还享有其他参与者收益函数的私人信息。例如在习题3.2中，对第3.1.A节非对称信息古诺模型加以修改，使两企业成本情况完全一致，但一个企业掌握市场需求水平，另一企业却不清楚。由于需求水平可以影响两个企业的收益函数，知道市场需求的企业的类型也就进入了另一企业的收益函数。在n个参与者的博弈中，我们允许参与者i的收益不仅决定于行动组合（a1，…，an），还决定于所有的类型（t1，…，tn），从而包含了这一可能情况，并据此把收益函数表示为ui（a1，…，an，t1，…，tn）。

1704419830

1704419831 第二个技术性问题涉及到推断pi（t-i|ti）。我们将假定在静态贝叶斯博弈时间顺序的第一步，即自然根据先验的概率分布p（t）赋予各参与者类型向量t=（t1，…，tn），是共同知识。当随后自然告知参与者i的类型ti时，他可以根据贝叶斯法则计算其他参与者类型的条件概率，得出推断pi（t-i|ti）[2]

1704419832

1704419833

1704419834

1704419835

1704419836 而且，另外参与者根据i的类型，也能够计算参与者i持有的不同推断，即对Ti，中的每一个ti，都可计算出pi（t-i|ti）。前面已经提到，我们将经常假定参与者的类型是相互独立的，这时pi（t-i）不再依赖于ti，但仍得自先验分布p（t），这种情况下，其他参与者知道参与者i对他们类型所持有的推断。

1704419837

1704419838 博弈论基础 [:1704417425]

1704419839 3.1.C 贝叶斯纳什均衡的定义

1704419840

1704419841 本节我们定义静态贝叶斯博弈的一个均衡概念。为此，必须首先定义此类博弈中参与者的战略空间。第2.3.B和第2.4.B节已经讲过，参与者的一个战略是关于行动的一个完整计划，包括了参与者在可能会遇到的每一种情况下将选择的可行行动。在给定的静态贝叶斯博弈的时间顺序中，自然首先行动，赋予每一参与者各自的类型，参与者i的一个（纯）战略必须包括参与者i在每一可行的类型下选择的一个可行行动。

1704419842

1704419843 定义在静态贝叶斯博弈G={A1，…，An，T1，…，Tn；p1，…，pn，；u1，…un}中，参与者i的一个战略是一个函数si（ti），其中对Ti中的每一类型ti，si（ti）包含了自然赋予i的类型为ti时，i将从可行集Ai中选择的行动。

1704419844

1704419845 不同于（静态及动态的）完全信息博弈，在贝叶斯博弈的标准式表述中没有给出参与者的战略空间。作为替代，在静态贝叶斯博弈中战略空间可从类型空间与行动空间中构建：参与者i的可行的（纯）战略集Si是定义域为Ti，值域为Ai的所有可能的函数集。例如一个分离战略（separating strategy），Ti中的每一类型ti都选择Ai中的不同行动ai；而在混同战略（pooling strategy）中，所有的类型都选择同一行动，分离战略和混同战略的这种区别在第4章讨论非完全信息动态博弈时十分重要，在这里提到这两个概念的区分，只是帮助说明从给定的类型空间Ti和行动空间Ai中，可以构建出多么宽泛而又差异巨大的战略。

1704419846

1704419847 也许有人认为，要求参与者i的战略包含参与者i每一种可能类型下的可行行动没有必要，毕竟，一旦自然赋予某参与者一特定类型并告知他，参与者就不必再关心如果自然赋予他的是另外一种类型他将如何行动了。但另一方面，参与者i还需要考虑另外的参与者将如何行动，而且另外参与者的行动又决定于他们对参与者i为Ti中每一类型ti时，i的行动的推断。从而，在被赋予某种类型之后要决定如何行动，参与者i仍必须考虑如果他被赋予Ti中另外每一ti时应该如何行动。

1704419848

1704419849

1704419850

1704419851

[ 上一页 ] [ :1.704419802e+09 ] [ 下一页 ]