1704640300
1704640301
图11.5(a) B先决策
1704640302
1704640303
1704640304
1704640305
1704640306
图11.5(b) A先决策
1704640307
1704640308
在图11.5(a)中,让游戏者B在其两种策略中取一种,再让A同时进行选择;在11.5(b)中,则让A在其策略集中选一种策略,再让B同时进行选择。
1704640309
1704640310
如果我们相信博弈的所有贴切的信息都被其策略型形式包含进去了,则实质上我们隐含了这样的结论:即由其转化而来的两种广延型形式11.5(a)与11.5(b)在本质上是同一的。
1704640311
1704640313
第三节 反向归纳——信息完美条件下广延型博弈解的方式
1704640314
1704640315
如果广延型博弈是信息完美的,则博弈的每一个决策点都是一个信息集。如果博弈具有这样好的性质,则解的方法也很方便,那是“反向归纳”(backward induction)。
1704640316
1704640317
一、反向归纳方法与举例
1704640318
1704640319
【定义】 反向归纳:反向归纳(backward induction)是指从博弈的最终结局出发,游戏者总是选择对自己最有利的结果;一旦知道博弈的最终结果是什么,然后转向次结局的那个决策点,以同样方法找出该点上的决策者会选择什么决策;然后回到次次结局的那个点→…→如此反复,直到博弈的初始点,在初始点上决策的那个游戏者决定博弈的最终结果。
1704640320
1704640321
例5:图11.3的反向归纳解。在图11.3里,次最终结果的决策点有两个,一个属于B决策,他可以选择X或Y;另一个属于C决策,他可以采取策略u′或w′。如果让C最终决策,C必然会选w′,这样A得3,B只得2,但C会得9。然后回到B决策的点,B看到自己如选X′,会只得2,不如选Y′,B可以拿3;于是,回到A决策点,A会看到,如选x′,会只得2,不如选y′,A可以得3;再回到C决策点,C拿u与w的结果比较,实质上是拿3与2比较,C当然会选u;然后A知道了如选z,自己只会得1。如A选y呢,B会选Y,这样A只有收益2;A不如选x,可以使自己得3。所以,最终,A是在x,y与z之间选,如选x,A得3;如选y,A得2;如选z,A只能得1。显然,A只会在初始点上选x,这样一步就结束了博弈。
1704640322
1704640323
通常,反向归纳的解法是采用递退的方法的。
1704640324
1704640325
例6(递退法):请看下图:
1704640326
1704640327
1704640328
1704640329
1704640330
图11.6(a) 初始博弈
1704640331
1704640332
运用“反向归纳”法,当决策者“1”最终决策时,其只会选R′或L″。于是,回到“2”决策这一点,博弈的广延型就递退为11.6(b):
1704640333
1704640334
1704640335
1704640336
1704640337
图11.6(b) 最终决策后的博弈
1704640338
1704640339
决策者“2”当然只选r或l′。回到初始点,即由决策者“1”来“夺定”,“1”实质上是在L与R之间选一个最好的策略:
1704640340
1704640341
1704640342
1704640343
1704640344
图11.6(c) 两次递退后的博弈
1704640345
1704640346
显然,A只会选择“R”,最终结果为两人收益都为零。
1704640347
1704640348
按“反向归纳”,在每一个信息完美的广延型博弈里,一定可以得到一个策略组合,这个策略组合就称“反向归纳策略组合”(“backward induction strategies”)。在上例中,反向归纳策略组合便是(R,l′)。
1704640349
[
上一页 ]
[ :1.7046403e+09 ]
[
下一页 ]