1704640211
有时,广延型博弈也可以按下例的样子画出:
1704640212
1704640213
例3:见图11.3。这是由三个游戏者A,B,C进行的博弈。在最初的空心点,由A作决策。A面临三个选择,x,y,z。每一个箭头都表示A可能做出的决策的结果。如果A选择了y,则下一个决策点就属于B,B可以选择X或Y,B的每一个选择都对应着一个向量(由三个数构成的向量)。当博弈达到某一个向量时,就说明博弈达到了某一个终极点。终极点上那三个数字表示的是每一个游戏者的收益。如果A从初始决策点出发,选择了x,则就结束了博弈,使A得3,B与C各得0;如果A在初始决策点上选择了y,然后由B决策,而B选择了X,则最终A,B,C三人的收益分别为4,2,4。如果A在初始决策点上选择了z,然后由C选择w,再由A选x′,B选Y′,则博弈最终以A得2,B得3,C得1收场。
1704640214
1704640215
1704640216
1704640217
1704640218
图11.3 蜈蚣型广延博弈
1704640219
1704640220
三、广延型博弈的规则
1704640221
1704640222
在用图描述广延型博弈时,有两个规则是不能违反的:
1704640223
1704640224
第一,每一个决策点至少有一个箭头指向它(表示至少有一个游戏者的行动会产生该结果),同时至多也只有一条箭头指向它。更具体一些说,对初始点没有一条箭头指向它;对其他所有箭头,都只有一条箭头指向它。这个规则可以保证“反向归纳”顺利进行。即,如果我们从除初始点以外的任何一点出发向初始点返回,那么,只有一条途径可以返回原点。
1704640225
1704640226
第二,如果我们从某一点向初始点返回,我们就不可能再通过迂回的途径回这一点,我们只能按反向逐次返回原点。
1704640227
1704640228
这两条规则保证了广延型博弈形式像决策树,树枝可以从某一点生出来,但决不会有两个树枝共同交于一个决策点的情形,也决不会发生某一个树枝重新长回到其本身的情形。从数学上来说,广延型的博弈的结果结构像树枝状(arborescence)。
1704640229
1704640231
第二节 广延型博弈与策略型博弈
1704640232
1704640233
关于这两种博弈型之间的关系,我们可以断言:
1704640234
1704640235
【定理】 对于每一个广延型博弈,都存在着一个对应的策略型博弈,我们可以把此策略型博弈视为是游戏者同时(simultaneously)选择策略的结果。但是,给出一个策略型博弈,一般地,总存在着若干个与此相对应的广延型博弈。(证明从略)
1704640236
1704640237
一、从广延型博弈到策略型博弈
1704640238
1704640239
我们从下列广延型博弈出发。
1704640240
1704640241
例4(讲真话博弈):假定自然在硬币的正面(H)与背面(T)之间做出了选择,这个选择结果只有游戏者S知道。由于对于S来说,自然选择的结果的信息是完美的,因此,从N(自然)到S的两个决策点,我们用实线表示。已知自然选择H的概率为0.8,自然选择T的概率为0.2。但是,S对R可以讲真话,也可以讲假话。如果自然选了H,S又对R报了“H”(讲了真话),然后轮到游戏者R去选择“h”与“t”。若R选了“h”,则S得30,R得10(左上方的上项);如R选了“t”,则S得10,R得0。但是,由于S在自然选了T之后,可以对R报“H”,然后由R选择,R如选“h”,则结果是(20,0);R若选“t”,则结果是(0,10)(即R挫败了S的谎言,R得的多,S得的少。)。由于R在面临S报“H”时,不能确定这个“H”是真还是假,所以,连结R的两个决策点的是一条虚线,这里,虚线代表R的信息集。同样道理,看上图右侧,R在面临S报“T”时,同样无法断定S究竟是讲了真话还是讲了假话,所以,连结R的两个决策点的线仍是虚线。
1704640242
1704640243
1704640244
1704640245
1704640246
图11.4 讲真话博弈
1704640247
1704640248
这是一个“讲真话”的博弈。S可以代表国有企业经理,R可以指国有企业的所有者——政府,政府看不见实际利润的水平是高还是低。“H”可以看成是“利润水平高”,若企业真实利润水平真的是高,经理报了“高”;政府按利润高的前提定奖金,则结果是经理可以多得(30),政府也可以有收益(10);如企业将“低”利润“高”报了,政府给了其奖励,但财政税收却收不上来,这样(T,“H”,“h”)的结果是(20,0)。如(T,“H”,“t”),说明政府认为经理多报了,给了经理惩罚,结果为(0,10)。如果(T,“T”,“t”),即利润的实际情况是低的,经理老实报了“低”,政府也按利润低来处理,结果政府与经理各得10。
1704640249
1704640250
如何把上述广延型博弈转化为策略型博弈呢?关键是把S与R的对策写出来。S的策略是在自然选择的结果昭然之后,选择报的变量。由于自然有2个选择的结果T与H,对每一个结果,S可以报真与假,所以,S实际上有4个对策:
1704640251
1704640252
S1:如自然选择H,报“H”;如自然选择T,报“H”;
1704640253
1704640254
S2:如自然选择H,报“H”;如自然选择T,报“T”;
1704640255
1704640256
S3:如自然选择H,报“T”;如自然选择T,报“H”;
1704640257
1704640258
S4:如自然选择H,报“T”;如自然选择T,报“T”。
1704640259
1704640260
以上是S的全部可能的策略,它表明了S在各种场合可能采取的行动。
[
上一页 ]
[ :1.704640211e+09 ]
[
下一页 ]