打字猴:1.704418143e+09
1704418143 博弈论基础 [:1704417387]
1704418144 1.3.B 纳什均衡的存在性
1704418145
1704418146 本节讨论和纳什均衡的存在性相关的几个问题。第一,我们把第1.1.C节中纳什均衡的定义扩展到包含混合战略的情况;第二,我们应用这一扩展后的定义求解猜硬币博弈和性别战博弈的纳什均衡;第三,我们用图示的方法证明任何一个参与者有两个纯战略的两人博弈都存在纳什均衡(可能包含了混合战略);最后,给出并讨论纳什定理(1950),它保证了在任何有限博弈(即有限个参与者,并且每个参与者可选择的纯战略有限的所有博弈)中,都存在纳什均衡(仍可能会包含混合战略)。
1704418147
1704418148 回顾第1.1.C节给出的纳什均衡定义,保证了每一参与者的纯战略都是其他参与者纯战略的最优反应战略。为把这一定义扩展到包含混合战略的情况,我们只需要求每一参与者的混合战略是其他参与者混合战略的最优反应。由于任何纯战略都可表示为混合战略——只要令该参与者所有其他纯战略出现的概率等于0——扩展后的定义完全包括了前一定义。
1704418149
1704418150 对参与者i来讲,参与者j的混合战略代表了他对j将选择战略的不确定性,并据此计算参与者i对j混合战略的最优反应。我们先以猜硬币博弈为例,假定参与者1推断参与者2会以q的概率出正面,以1-q的概率出背面,亦即参与者1推断参与者2将使用混合战略(q,l-q)。据此推断,参与者1出正面可得的期望收益为q(-1)+(1-q)·1=1-2q,出背面的期望收益为q·1+(1-q)(-1)=2q-1。由于当且仅当q<l/2时,1-2q>2q-1,则q<1/2时,参与者1的最优纯战略为出正面;q>l/2时为出背面;当q=1/2时,参与者1出哪一面都是无差异的。余下的就是参与者1可能的混合战略反应。
1704418151
1704418152 令(r,l-r)表示参与者1的混合战略,其出正面的概率为r,对任意0到1之间的q,现在我们计算r的值,用r*(q)表示,从而使(r,1-r)为参与者2选择(q,1-q)时参与者1的最优反应,其结果可以表示为图1.3.3。当参与者2选择(q,1-q)时,参与者1选择(r,1-r)的期望收益为:
1704418153
1704418154 rq·(-1)+r(l-q)·1+(1-r)q·1+(1-r)(l-q)·(-1)=(2q+1)+r(2-4q) (1.3.1)
1704418155
1704418156 其中,rq是(正面,正面)的概率,r(l-q)是(正面,背面)的概率,如此等等。[14]由于参与者1的期望收益在2-4q>0时随r递增;在2-4q<0时随r递减,则如果q<1/2,参与者1的最优反应为r=l(即出正面);如果q>1/2,参与者1的最优反应为r=0(即出背面),如图1.3.3所示r*(q)两段水平虚线。这一表述比上面非常相近的表述条件要强:那里我们只考虑纯战略,并发现如果q<1/2,正面为最优纯战略,如果q>1/2,背面为最优纯战略;这里我们考虑所有的纯战略和混合战略,同样发现如果q<1/2,正面是所有战略(包含纯战略和混合战略)中的最优选择,如果q>1/2,背面是所有战略中最优的。
1704418157
1704418158
1704418159
1704418160
1704418161 图1.3.3
1704418162
1704418163 当q=1/2时,参与者对(q,1-q)最优反应的性质有所变化。前面已经提到,在q=l/2时,参与者1选择纯战略正面或背面是无差异的。而且,因为参与者1在(1.3.1)中的期望收益在q=1/2时与r无关,所有混合战略(r,1-r)对1都是无差异的。也就是说,当q=1/2时,对于0到1之间的任何r,混合战略(r,1-r)都是(q,1-q)的最优反应。那么,r*(1/2)就是[0,1]间的整个区间,即图1.3.3所示r*(q)中间的竖线段。在第1.2.A节分析古诺模型时,我们称ri(qj)为企业i的最优反应函数。在这里,因为存在一个q的值,使r*(q)有不止一个解,我们称r*(q)为参与者1的最优反应对应(best-response correspondence)。
1704418164
1704418165 为在更为一般的条件下推导出参与者i对参与者j混合战略的最优反应,进一步给出扩展的纳什均衡的正式定义,我们首先分析两个参与者的情况,从而可以通过最简单的方式说明主要思想。令J表示S1中包含纯战略的个数,K表示S2包含纯战略的个数,则S1={s11,…,s1J},S2={s21,…,s2K},我们用s1j和s2k分别表示S1、S2中任意一个纯战略。
1704418166
1704418167 如果参与者1推断参与者2将以(Ρ21,…,Ρ2k)的概率选择战略(s21,…,Ρ2k),则参与者1选择纯战略s1j的期望收益为:
1704418168
1704418169
1704418170
1704418171
1704418172 且参与者1选择混合战略P1(Ρ11,…,Ρ1J)的期望收益为:
1704418173
1704418174
1704418175
1704418176
1704418177 其中,Ρ1j×Ρ2k表示参与者选择s1j且参与者2选择s2k的概率。根据(1.3.3),参与者1选择混合战略P1的期望收益,等于按(1.3.2)给出的每一个纯战略{s11,…,s1J}的期望收益的加权和,其权重分别为各自的概率(Ρ11,…,Ρ1J),那么,参与者1的混合战略(Ρ11,…,Ρ1J)要成为他对参与者2战略P2的最优反应,其中任何大于0的Ρ1j相对应的纯战略必须满足:
1704418178
1704418179
1704418180
1704418181
1704418182 对S1中每一个s’1j都成立。这表明,一个混合战略要成为P2的最优反应,混合战略中每一个概率大于0的纯战略本身也必须是对P2的最优反应。反过来讲,如果参与者1有n个纯战略都是P2的最优反应,则这些纯战略全部或部分的任意线性组合(同时其他纯战略的概率为0)形成的混合战略同样是参与者1对P2的最优反应。
1704418183
1704418184 为给出扩展的纳什均衡的正式定义,我们还需要计算当参与者1和2分别选择混合战略P1和P2时参与者2的期望收益。如果参与者2推断参与者1将分别以(Ρ11,…,Ρ1J)的概率选择战略{s11,…,s1J}则参与者2分别以概率(Ρ21,…,Ρ2k)选择战略(s21,…,s2k)时的期望收益为
1704418185
1704418186
1704418187
1704418188
1704418189
1704418190
1704418191
1704418192 在给出υ1(P1,P2)和P2)后,我们可以重新表述纳什均衡的必要条件,即每一参与者的混合战略是另一参与者混合战略的最优反应:一对混合战略(,)要成为纳什均衡,必须满足
[ 上一页 ]  [ :1.704418143e+09 ]  [ 下一页 ]