打字猴:1.7046403e+09

1704640300

1704640301 图11.5（a）　B先决策

1704640302

1704640303

1704640304

1704640305

1704640306 图11.5（b）　A先决策

1704640307

1704640308 在图11.5（a）中，让游戏者B在其两种策略中取一种，再让A同时进行选择；在11.5（b）中，则让A在其策略集中选一种策略，再让B同时进行选择。

1704640309

1704640310 如果我们相信博弈的所有贴切的信息都被其策略型形式包含进去了，则实质上我们隐含了这样的结论：即由其转化而来的两种广延型形式11.5（a）与11.5（b）在本质上是同一的。

1704640311

1704640312 微观经济学十八讲 [:1704632861]

1704640313 第三节　反向归纳——信息完美条件下广延型博弈解的方式

1704640314

1704640315 如果广延型博弈是信息完美的，则博弈的每一个决策点都是一个信息集。如果博弈具有这样好的性质，则解的方法也很方便，那是“反向归纳”（backward induction）。

1704640316

1704640317 一、反向归纳方法与举例

1704640318

1704640319 【定义】　反向归纳：反向归纳（backward induction）是指从博弈的最终结局出发，游戏者总是选择对自己最有利的结果；一旦知道博弈的最终结果是什么，然后转向次结局的那个决策点，以同样方法找出该点上的决策者会选择什么决策；然后回到次次结局的那个点→…→如此反复，直到博弈的初始点，在初始点上决策的那个游戏者决定博弈的最终结果。

1704640320

1704640321 例5：图11.3的反向归纳解。在图11.3里，次最终结果的决策点有两个，一个属于B决策，他可以选择X或Y；另一个属于C决策，他可以采取策略u′或w′。如果让C最终决策，C必然会选w′，这样A得3，B只得2，但C会得9。然后回到B决策的点，B看到自己如选X′，会只得2，不如选Y′，B可以拿3；于是，回到A决策点，A会看到，如选x′，会只得2，不如选y′，A可以得3；再回到C决策点，C拿u与w的结果比较，实质上是拿3与2比较，C当然会选u；然后A知道了如选z，自己只会得1。如A选y呢，B会选Y，这样A只有收益2；A不如选x，可以使自己得3。所以，最终，A是在x，y与z之间选，如选x，A得3；如选y，A得2；如选z，A只能得1。显然，A只会在初始点上选x，这样一步就结束了博弈。

1704640322

1704640323 通常，反向归纳的解法是采用递退的方法的。

1704640324

1704640325 例6（递退法）：请看下图：

1704640326

1704640327

1704640328

1704640329

1704640330 图11.6（a）　初始博弈

1704640331

1704640332 运用“反向归纳”法，当决策者“1”最终决策时，其只会选R′或L″。于是，回到“2”决策这一点，博弈的广延型就递退为11.6（b）：

1704640333

1704640334

1704640335

1704640336

1704640337 图11.6（b）　最终决策后的博弈

1704640338

1704640339 决策者“2”当然只选r或l′。回到初始点，即由决策者“1”来“夺定”，“1”实质上是在L与R之间选一个最好的策略：

1704640340

1704640341

1704640342

1704640343

1704640344 图11.6（c）　两次递退后的博弈

1704640345

1704640346 显然，A只会选择“R”，最终结果为两人收益都为零。

1704640347

1704640348 按“反向归纳”，在每一个信息完美的广延型博弈里，一定可以得到一个策略组合，这个策略组合就称“反向归纳策略组合”（“backward induction strategies”）。在上例中，反向归纳策略组合便是（R，l′）。

1704640349

[ 上一页 ] [ :1.7046403e+09 ] [ 下一页 ]