1704418897
2.3.A 理论:两阶段重复博弈
1704418898
1704418899
考虑图2.3.1给出的囚徒困境的标准式,假设两个参与者要把这样一个同时行动博弈重复进行两次,且在第二次博弈开始之前可观测第一次进行的结果,并假设整个过程博弈的收益等于两阶段各自收益的简单相加(即不考虑贴现因素),我们称这一重复进行的博弈为两阶段囚徒困境。它属于第2.2.A节分析过的博弈类型,这里参与者3、4与参与者1、2是相同的,行动空间A3和A4也与A1、A2相同,并且总收益Ui(a1,a2,a3,a4)等于第一阶段结果(a1,a2)的收益与第二阶段结果(a3,a4)的收益简单相加。而且,两阶段囚徒困境满足我们在第2.2.A节所作的假定:对每一个第一阶段的可行结果(a1,a2),其余部分在参与者3和4之间进行的博弈都存在惟一的纳什均衡,表示为(a3*(a1,a2),a4*(a1,a2))。事实上,两阶段囚徒困境满足比上述假定更为严格的条件:在第2.2.A节中,我们允许其余第二阶段博弈的纳什均衡依赖于第一阶段的结果——从而我们表示为(a3*(a1,a2),a4*(a1,a2)),而不是简单的(a3*,a4*)(例如在关税博弈中,第二阶段企业选择的均衡产量决定于政府在第一阶段所选择的关税),但在两阶段囚徒困境中,第二阶段博弈惟一的纳什均衡就是(L1,L2),不管第一阶段的结果如何。
1704418900
1704418901
1704418902
1704418903
1704418904
图2.3.1
1704418905
1704418906
1704418907
1704418908
1704418909
图2.3.2
1704418910
1704418911
根据在第2.2.A节讲过的求解此类博弈子博弈精炼解的程序,第二阶段博弈的结果为该阶段所余部分博弈的纳什均衡,在本例中,即为(L1,L2),两人收益为(1,1),我们在此前提下分析两阶段囚徒困境第一阶段的情况。由此,两阶段囚徒困境中,参与者在第一阶段的局势就可归纳为图2.3.2所示的一次性博弈,其中,第二阶段的均衡收益(1,1)分别被加到两人第一阶段每一收益组合之上。图2.3.2所示的博弈同样有惟一的纳什均衡:(L1,L2)。从而,两阶段囚徒困境惟一的子博弈精炼解就是第一阶段的(L1,L2)和随后第二阶段的(L1,L2)。在子博弈精炼解中,任一阶段都不能达成相互合作——(R1,R2)的结果。
1704418912
1704418913
这一结论在更为一般的条件下同样成立(这里我们暂时离开两阶段的例子,允许任何有限的T次重复)。令G={A1,…,An;u1,…,un}表示一个完全信息博弈,其中参与者1到n同时从各自的行动空间A1到A4中分别选择行动a1到an,得到的收益分别为u1(a1,…,an),…un(a1,…,an),此后我们称博弈G为重复博弈中的阶段博弈。
1704418914
1704418915
定义 对给定的阶段博弈G,令G(T)表示G重复进行T次的有限重复博弈,并且在下一次博弈开始前,所有以前博弈的进行都可被观测到。G(T)的收益为T次阶段博弈收益的简单相加。
1704418916
1704418917
定理 如果阶段博弈G有惟一的纳什均衡,则对任意有限的T,重复博弈G(T)有惟一的子博弈精炼解:即G的纳什均衡结果在每一阶段重复进行。[13]
1704418918
1704418919
1704418920
1704418921
1704418922
图2.3.3
1704418923
1704418924
现在,我们回到两阶段博弈,进一步考虑阶段博弈G有多个纳什均衡的情况,如图2.3.3所示。战略Li和Mi与图2.3.1所示的囚徒困境完全相同,只不过增加了战略Ri使博弈有了两个纯战略纳什均衡:其一是囚徒困境中的(L1,L2),另外还有(R1,R2)这个例子中凭空给囚徒的困境增加了一个均衡解当然是很主观的,但在此博弈中我们的兴趣主要在理论上,而非其经济学意义。在下一节我们将看到,即使重复进行的阶段博弈像囚徒的困境一样有惟一的纳什均衡,但当重复博弈无限次进行下去时,仍表现出这里所分析的多均衡特征。从而,本节我们在最简单的两阶段情况下分析一个抽象的阶段博弈,以后再分析由有经济学意义的阶段博弈构成的无限重复博弈也就十分容易了。
1704418925
1704418926
设图2.3.3表示的阶段博弈重复进行两次,并在第二阶段开始前可以观测到第一阶段的结果,我们可以证明在这一重复博弈中存在一个子博弈精炼解,其中第一阶段的战略组合为(M1,M2)[14]。和第2.2.A节相同,假定在第一阶段参与者预测第二阶段的结果将会是下一阶段博弈的一个纳什均衡,由于这里阶段博弈有不止一个纳什均衡,因而参与者可能会预测根据第一阶段的不同结果,在第二阶段的博弈中将会出现不同的纳什均衡。例如,设参与者预测如果第一阶段的结果是(M1,M2),第二阶段的结果将会是(R1,R2),而如果第一阶段中其他8个结果的任何一个出现,第二阶段的结果就将会是(L1,L2),那么参与者在第一阶段所面临的局势就可归为图2.3.4所示的一次性博弈,其中在(M1,M2)单元加上了(3,3),在其余8个单元各加上(1,1)。
1704418927
1704418928
1704418929
1704418930
1704418931
图2.3.4
1704418932
1704418933
在图2.3.4的博弈中有3个纯战略纳什均衡:(L1,L2),(M1,M2)和(R1,R2)。和在图2.3.2中一样,这个一次性博弈中的纳什均衡对应着重复博弈的子博弈精炼解。令(w,x),(y,z)表示重复博弈的一个结果——第一阶段和第二阶段的行动分别为(w,x)和(y,z)。图2.3.4中的纳什均衡(L1,L2)对应着重复博弈的子博弈精炼解((L1,L2),(L1,L2)),因为除第一阶段的结果是(M1,M2)外,其他任何情况发生时,第二阶段的结果都将是(L1,L2)。类似地,图2.3.4中的纳什均衡(R1,R2)对应了重复博弈的子博弈精炼解((R1,R2),(L1,L2))。重复博弈的这两个子博弈精炼解都简单地由两个阶段博弈的纳什均衡解相串而成,但图2.3.4里的第三个纳什均衡结果却与前两者存在质的差别:图2.3.4中的(M1,M2)对应的重复博弈子博弈精炼解为((M1,M2),(R1,R2)),因为对(M1,M2)之后的第二阶段结果预期是(R1,R2),亦即正如我们前面讲过的,在重复博弈的子博弈精炼解中,合作可以在第一阶段达成。下面是更为一般的情况:如果G={A1,…,An;u1,…,un}是一个有多个纳什均衡的完全信息静态博弈,则重复博弈G(T)可以存在子博弈精炼解,其中对每一t<T,t阶段的结果都不是G的纳什均衡,下一节我们在讨论无限重复博弈时还将涉及这一理念。
1704418934
1704418935
这个例子要说明的主要观点是,对将来行动所作的可信的威胁或承诺可以影响到当前的行动。不过另外一点,也说明了子博弈精炼的概念对可信性的要求并不严格。例如,在推导子博弈精炼解((M1,M2),(R1,R2))时,我们假定如果第一阶段的结果是(M1,M2),则参与双方都预期(R1,R2)将是第二阶段的解,如果第一阶段出现了任何其他8种结果之一,第二阶段的结果就会是(L1,L2)。但是,由于第二阶段的博弈中,(R1,R2)亦为可选择的纳什均衡,而相应的收益为(3,3),这时选择收益为(1,1)的(L1,L2)看起来就比较愚蠢了。不严格地看,参与双方进行重新谈判似乎是很自然的事[15]。如果第一阶段的结果并不是(M1,M2),从而双方第二阶段的行动应该是(L1,L2),那么每一个参与者可能会理性地认为过去的反正已经过去了,在余下的阶段博弈中就会选择双方都偏好的均衡行动(R1,R2)。但是如果对每个第一阶段的结果,第二阶段的结果都将是(R1,R2)的话,则第一阶段选择(M1,M2)的动机就被破坏了:两个参与者在第一阶段面临的局势就可以简化表示为图2.3.3所示阶段博弈的每一单元格中的收益都加上(3,3)后形成的一次性博弈,于是i对Mj的最优反应就成为Li。
1704418936
1704418937
为说明这一重新谈判问题的解决思路,我们考虑图2.3.5所示的博弈。和图2.3.3的博弈相比,它的人为设计的痕迹更为明显。同样,我们对这一博弈的分析只为了说明问题,而不考虑其经济学含义,从这一人为博弈中我们得出的有关重新谈判的观点,亦可应用于对无限重复博弈中重新谈判的分析;参见法雷尔罗和马斯金(1989)提供的例子。
1704418938
1704418939
1704418940
1704418941
1704418942
图2.3.5
1704418943
1704418944
这里的阶段博弈在图2.3.3的基础上又加上了战略pi和Qi,从而阶段博弈有了四个纯战略纳什均衡:(L1,L2)和(R1,R2),同时又增加了(P1,P2)和(Q1,Q2)。与上例相同,和(L1,L2)相比,参与双方都更倾向于选择(R1,R2)。但更重要的,图2.3.5的博弈中,不存在一个纳什均衡(x,y),使参与双方和(P1,P2)或(Q1,Q2)或(R1,R2)相比,都更倾向于选择(x,y)。我们称(R1,R2)帕累托优于(Pareto-dominates)(L1,L2),而且(P1,P2)、(Q1,Q2)和(R1,R2)都处于图2.3.5所示博弈的纳什均衡收益的帕累托边界(Pareto frontier)之上。
1704418945
[
上一页 ]
[ :1.704418896e+09 ]
[
下一页 ]