打字猴:1.704418625e+09
1704418625 下面是对三阶段谈判博弈时序的更为详细的描述:
1704418626
1704418627 (1a)在第一阶段开始时,参与人1建议他分走1美元的s1,留给参与人2的份额为l-s1;
1704418628
1704418629 (1b)参与人2或者接受这一条件(这种情况下,博弈结束,参与人1的收益为s1,参与人2的收益为1-s1,都可立刻拿到),或者拒绝这一条件(这种情况下,博弈将继续进行,进入第二阶段);
1704418630
1704418631 (2a)在第二阶段的开始,参与人2提议参与人1分得1美元的s2,留给参与人2的份额为1-s1(请注意在阶段t,st总是表示分给参与人1的,而不论是谁先提出的条件);
1704418632
1704418633 (2b)参与人1或者接受条件(这种情况下,博弈结束,参与人1的收益s2和参与人2的收益1-s2都可立即拿到),或者拒绝这一条件(这种情况下,博弈继续进行,进入第三阶段);
1704418634
1704418635 (3)在第三阶段的开始,参与人1得到1美元的s,参与人2得到1-s,这里0<s<1。
1704418636
1704418637 在这样的三阶段博弈中,第三阶段的解决方案(s,1-s)是外生给定的。在我们后面将考虑的无限期模型中,第三阶段的收益s将表示如果博弈进行到第三阶段(即如果前面两个提议都被拒绝)的话,参与人1在其后进行的博弈中可得到的收益。
1704418638
1704418639
1704418640 为解出此三阶段博弈的逆向归纳解,首先需要计算如果博弈进行到第二阶段,参与人2可能提出的最优条件。参与人1拒绝参与人2在这一阶段的条件s2,可以在第三阶段得到s,但下一阶段的s在当期的价值只有δs。那么,当且仅当s2≥·s,参与人1才会接受s2(我们假定当接受和拒绝并无差异时,参与人总是选择接受条件)。从而参与人2在第二阶段的决策问题就可归于在本阶段收入1-δ·s(通过向参与人1提出条件,给他s2=δ·s)和下阶段收入1-s(通过向参与人1提出条件,给他任意的s2<δ·s)之间作出选择。后一选择的贴现值为δ·(1-s),小于前一选择可得的1-δ·s,于是参与人2在第二阶段可以提出的最优条件是s2*=δ·s。也就是说,如果博弈进行到第二阶段,参与人2将提出条件,参与人1选择接受条件。
1704418641
1704418642
1704418643
1704418644
1704418645
1704418646
1704418647
1704418648
1704418649
1704418650
1704418651
1704418652
1704418653
1704418654
1704418655 由于参与人1可以和参与人2同样地解出参与人2在第二阶段的决策问题,参与人1也就知道参与人2通过拒绝参与人1的条件,在第二阶段可以得到,但下一阶段得到的在本阶段的价值只有。那么,当且仅当或时,参与人2才会接受1-s1。从而参与人1在第一阶段的决策问题就可归于在本阶段收入(通过向参与人2提出条件)和下阶段收入(通过向参与人2提出出任意的)之间作出选择。后一选择的贴现值为,小于前一选择可得的,于是参与人1在第一阶段提出的最优条件是。这样,在此三阶段博弈的逆向归纳解中,参与人1向参与人2提出分配方案,后者接受该方案。
1704418656
1704418657 现在考虑无限期的情况。博弈时序和前面的描述完全一致,只是第(3)阶段给出的外生解决方案被其后的无限步讨价还价(3a)、(3b)、(4a)、(4b)等等所代替:奇数步由参与人1出条件,偶数步由参与人2出条件,直至一方接受条件,讨价还价结束。和前面分析过的所有应用一样,我们希望能够从后向前推出这一无限步博弈的逆向归纳解。但是,由于博弈可能会无限地进行下去,因此并不存在我们借以入手分析的最后一步行动。幸而下面的发现(首先由谢克德和萨顿(Shaked&Sutton,1984)所运用),使我们可以把无限博弈截开,并应用对有限博弈分析的逻辑进行分析:从第三阶段开始的博弈(如果能进行到这一阶段)与(从第一阶段开始的)整个过程的博弈是相同的——两种情况下,都是由参与人1首先提出条件,其后两个参与人轮流出价,直至有一方接受条件谈判结束。
1704418658
1704418659 由于尚未正式定义此类无限博弈的逆向归纳解,我们的讨论也将是非正式的(但也可以进行正式讨论)。假设完整过程的博弈存在逆向归纳解,此时参与人1和2分别得到s和1-s。我们可以把这个结果用于从第三阶段开始的博弈,如果博弈进行到第三阶段的话,然后逆向推至第一阶段(过程与三阶段博弈中相同),可计算出整个博弈的新的逆向归纳解。在这一新的逆向归纳解中,参与人1将在第一阶段提出解决方案(f(s),l-f(s)),参与人2会接受这一方案。这里的f(s)=1-δ(1-δ·s),就是上面讨论过的,在第三阶段解决方案(s,1-s)外生给定条件下,参与人1第一阶段得到的份额。
1704418660
1704418661 令sH为参与人1在全过程博弈中可能得到的逆向归纳解下的最高收益。设想sH为参与人1第三阶段的收益,则如前所述,这将产生一个新的逆向归纳解,其中参与人1第一阶段的收益为f(sH)。由于f(s)=l-δ+δ2s是s的增函数,sH是第三阶段可能达到的最高收益,f(sH)也就是第一阶段可能达到的最高收益。但同时sH又是第一阶段可能达到的最高收益,于是有f(sH)=sH。相似的论证可证明f(sL)=sL,这里的sL为参与人1在全过程博弈中可能得到的逆向归纳解下的最低收益。满足f(s)=s的惟一的s值为1/(1+δ),我们用S*表示。那么sH=sL=s*,于是整个过程博弈有惟一的逆向归纳解:在第一阶段,参与人1向参与人2提出分配方案(s*=1/(1+δ),l-s*=δ/(l+δ)),后者接受该方案。
1704418662
1704418663
1704418664
1704418665
1704418666 博弈论基础 [:1704417400]
1704418667 博弈论基础 2.2 完全非完美信息两阶段博弈
1704418668
1704418669 博弈论基础 [:1704417401]
1704418670 2.2.A 理论:子博弈精炼
1704418671
1704418672 现在我们对前一节所讨论的博弈类型加以丰富。和在完全且完美信息动态博弈中相同,我们继续假定博弈的进行分为一系列的阶段,下一阶段开始前参与者可观察到前面所有阶段的行动。与上节分析的不同之处在于,本节我们每一阶段中存在着同时行动。在第2.4节更进一步的分析中我们将看到,这种阶段内的同时行动意味着本节分析的博弈包含了不完美信息。然而,此类博弈和前一节所讨论的博弈又有着很多共同特性。
1704418673
1704418674 我们将分析以下类型的简单博弈,并(多么缺乏创意地)称其为完全非完美信息两阶段博弈:
[ 上一页 ]  [ :1.704418625e+09 ]  [ 下一页 ]