打字猴:1.704640211e+09

1704640211 有时，广延型博弈也可以按下例的样子画出：

1704640212

1704640213 例3：见图11.3。这是由三个游戏者A，B，C进行的博弈。在最初的空心点，由A作决策。A面临三个选择，x，y，z。每一个箭头都表示A可能做出的决策的结果。如果A选择了y，则下一个决策点就属于B，B可以选择X或Y，B的每一个选择都对应着一个向量（由三个数构成的向量）。当博弈达到某一个向量时，就说明博弈达到了某一个终极点。终极点上那三个数字表示的是每一个游戏者的收益。如果A从初始决策点出发，选择了x，则就结束了博弈，使A得3，B与C各得0；如果A在初始决策点上选择了y，然后由B决策，而B选择了X，则最终A，B，C三人的收益分别为4，2，4。如果A在初始决策点上选择了z，然后由C选择w，再由A选x′，B选Y′，则博弈最终以A得2，B得3，C得1收场。

1704640214

1704640215

1704640216

1704640217

1704640218 图11.3　蜈蚣型广延博弈

1704640219

1704640220 三、广延型博弈的规则

1704640221

1704640222 在用图描述广延型博弈时，有两个规则是不能违反的：

1704640223

1704640224 第一，每一个决策点至少有一个箭头指向它（表示至少有一个游戏者的行动会产生该结果），同时至多也只有一条箭头指向它。更具体一些说，对初始点没有一条箭头指向它；对其他所有箭头，都只有一条箭头指向它。这个规则可以保证“反向归纳”顺利进行。即，如果我们从除初始点以外的任何一点出发向初始点返回，那么，只有一条途径可以返回原点。

1704640225

1704640226 第二，如果我们从某一点向初始点返回，我们就不可能再通过迂回的途径回这一点，我们只能按反向逐次返回原点。

1704640227

1704640228 这两条规则保证了广延型博弈形式像决策树，树枝可以从某一点生出来，但决不会有两个树枝共同交于一个决策点的情形，也决不会发生某一个树枝重新长回到其本身的情形。从数学上来说，广延型的博弈的结果结构像树枝状（arborescence）。

1704640229

1704640230 微观经济学十八讲 [:1704632860]

1704640231 第二节　广延型博弈与策略型博弈

1704640232

1704640233 关于这两种博弈型之间的关系，我们可以断言：

1704640234

1704640235 【定理】　对于每一个广延型博弈，都存在着一个对应的策略型博弈，我们可以把此策略型博弈视为是游戏者同时（simultaneously）选择策略的结果。但是，给出一个策略型博弈，一般地，总存在着若干个与此相对应的广延型博弈。（证明从略）

1704640236

1704640237 一、从广延型博弈到策略型博弈

1704640238

1704640239 我们从下列广延型博弈出发。

1704640240

1704640241 例4（讲真话博弈）：假定自然在硬币的正面（H）与背面（T）之间做出了选择，这个选择结果只有游戏者S知道。由于对于S来说，自然选择的结果的信息是完美的，因此，从N（自然）到S的两个决策点，我们用实线表示。已知自然选择H的概率为0.8，自然选择T的概率为0.2。但是，S对R可以讲真话，也可以讲假话。如果自然选了H，S又对R报了“H”（讲了真话），然后轮到游戏者R去选择“h”与“t”。若R选了“h”，则S得30，R得10（左上方的上项）；如R选了“t”，则S得10，R得0。但是，由于S在自然选了T之后，可以对R报“H”，然后由R选择，R如选“h”，则结果是（20，0）；R若选“t”，则结果是（0，10）（即R挫败了S的谎言，R得的多，S得的少。）。由于R在面临S报“H”时，不能确定这个“H”是真还是假，所以，连结R的两个决策点的是一条虚线，这里，虚线代表R的信息集。同样道理，看上图右侧，R在面临S报“T”时，同样无法断定S究竟是讲了真话还是讲了假话，所以，连结R的两个决策点的线仍是虚线。

1704640242

1704640243

1704640244

1704640245

1704640246 图11.4　讲真话博弈

1704640247

1704640248 这是一个“讲真话”的博弈。S可以代表国有企业经理，R可以指国有企业的所有者——政府，政府看不见实际利润的水平是高还是低。“H”可以看成是“利润水平高”，若企业真实利润水平真的是高，经理报了“高”；政府按利润高的前提定奖金，则结果是经理可以多得（30），政府也可以有收益（10）；如企业将“低”利润“高”报了，政府给了其奖励，但财政税收却收不上来，这样（T，“H”，“h”）的结果是（20，0）。如（T，“H”，“t”），说明政府认为经理多报了，给了经理惩罚，结果为（0，10）。如果（T，“T”，“t”），即利润的实际情况是低的，经理老实报了“低”，政府也按利润低来处理，结果政府与经理各得10。

1704640249

1704640250 如何把上述广延型博弈转化为策略型博弈呢？关键是把S与R的对策写出来。S的策略是在自然选择的结果昭然之后，选择报的变量。由于自然有2个选择的结果T与H，对每一个结果，S可以报真与假，所以，S实际上有4个对策：

1704640251

1704640252 S1：如自然选择H，报“H”；如自然选择T，报“H”；

1704640253

1704640254 S2：如自然选择H，报“H”；如自然选择T，报“T”；

1704640255

1704640256 S3：如自然选择H，报“T”；如自然选择T，报“H”；

1704640257

1704640258 S4：如自然选择H，报“T”；如自然选择T，报“T”。

1704640259

1704640260 以上是S的全部可能的策略，它表明了S在各种场合可能采取的行动。

[ 上一页 ] [ :1.704640211e+09 ] [ 下一页 ]