1704418122
1704418123
更为一般地,假设参与者i有K个纯战略:Si={si1,…,siK},则参与者i的一个混合战略是一个概率分布(Ρi1,…,ΡiK),其中表示对所有k=1,…,K,参与者i选择战略sik的概率,由于Ρik是一个概率,对所有k=1,…,K,有0≤Ρik≤1且Ρi1+…+ΡiK=1。我们用Ρi表示基于Si的任意一个混合战略,其中包含了选择每一个纯战略的概率,正如我们用si表示内任意一个纯战略。
1704418124
1704418125
定义 对标准式博弈G={S1,…,Sn;u1,…,un},假设Si={si1,…,siK}。那么,参与者i的一个混合战略为概率分布Ρi=(Ρi1,…,ΡiK),其中对所有k=1,…,K,0≤Ρik≤1,且Ρi1+…+ΡiK=1。
1704418126
1704418127
作为本节的一个小结,我们简单地回顾一下第1.1.B节中介绍的严格劣战略,并说明混合战略对那里的论证所起的潜在作用。当时讲到,如果战略si为严格劣战略,那么参与者i不可能作出这样的推断(针对其他参与者的战略选择),他的最优反应战略会是si。如果我们引入混合战略,就可证明其逆命题:如果(针对其他参与者的战略选择)参与者i都不可能作出这样的推断,即其战略si会成为最优反应战略,则一定存在另一战略严格优于si。[13]图1.3.1和图1.3.2所示博弈说明了如果我们只讨论纯战略,这一逆命题是不成立的。
1704418128
1704418129
1704418130
1704418131
1704418132
图1.3.1
1704418133
1704418134
图1.3.1显示出,一个给定的纯战略可能会严格劣于一个混合战略,即使这个纯战略并不严格劣于其他任何一个纯战略。在这一博弈中,针对参与人1对参与人2可能行动所作出的任何推断(q,1-q),1的最优反应要么是T(在q≥1/2时),要么是M(在q≤l/2时),但不会是B,虽然T或M都不严格优于B。这里的关键在于B是T和M的一个混合战略的严格劣战略:如果参与者1以1/2的概率出T,以1/2的概率出M,则其期望收益为3/2,不管2将会选择什么(纯的或混合的)战略,3/2都大于选择B时将得到的收益1。这个例子说明了在“寻找另外一个严格优于的战略”时,混合战略所起的作用。
1704418135
1704418136
1704418137
1704418138
1704418139
图1.3.2
1704418140
1704418141
图1.3.2说明了一个给定的纯战略可以是针对一个混合战略的最优反应,即使这一纯战略并不是对方任何一个纯战略的最优反应。在此博弈中,对参与人2的纯战略L和R来说,参与人1的最优反应都不是B,但B却是针对参与人2的混合战略(q,1-q)9当1/3<q<2/3时参与人1的最优反应。这一例子说明了混合战略在“参与者i可能持有的推断”中的作用。
1704418142
1704418144
1.3.B 纳什均衡的存在性
1704418145
1704418146
本节讨论和纳什均衡的存在性相关的几个问题。第一,我们把第1.1.C节中纳什均衡的定义扩展到包含混合战略的情况;第二,我们应用这一扩展后的定义求解猜硬币博弈和性别战博弈的纳什均衡;第三,我们用图示的方法证明任何一个参与者有两个纯战略的两人博弈都存在纳什均衡(可能包含了混合战略);最后,给出并讨论纳什定理(1950),它保证了在任何有限博弈(即有限个参与者,并且每个参与者可选择的纯战略有限的所有博弈)中,都存在纳什均衡(仍可能会包含混合战略)。
1704418147
1704418148
回顾第1.1.C节给出的纳什均衡定义,保证了每一参与者的纯战略都是其他参与者纯战略的最优反应战略。为把这一定义扩展到包含混合战略的情况,我们只需要求每一参与者的混合战略是其他参与者混合战略的最优反应。由于任何纯战略都可表示为混合战略——只要令该参与者所有其他纯战略出现的概率等于0——扩展后的定义完全包括了前一定义。
1704418149
1704418150
对参与者i来讲,参与者j的混合战略代表了他对j将选择战略的不确定性,并据此计算参与者i对j混合战略的最优反应。我们先以猜硬币博弈为例,假定参与者1推断参与者2会以q的概率出正面,以1-q的概率出背面,亦即参与者1推断参与者2将使用混合战略(q,l-q)。据此推断,参与者1出正面可得的期望收益为q(-1)+(1-q)·1=1-2q,出背面的期望收益为q·1+(1-q)(-1)=2q-1。由于当且仅当q<l/2时,1-2q>2q-1,则q<1/2时,参与者1的最优纯战略为出正面;q>l/2时为出背面;当q=1/2时,参与者1出哪一面都是无差异的。余下的就是参与者1可能的混合战略反应。
1704418151
1704418152
令(r,l-r)表示参与者1的混合战略,其出正面的概率为r,对任意0到1之间的q,现在我们计算r的值,用r*(q)表示,从而使(r,1-r)为参与者2选择(q,1-q)时参与者1的最优反应,其结果可以表示为图1.3.3。当参与者2选择(q,1-q)时,参与者1选择(r,1-r)的期望收益为:
1704418153
1704418154
rq·(-1)+r(l-q)·1+(1-r)q·1+(1-r)(l-q)·(-1)=(2q+1)+r(2-4q) (1.3.1)
1704418155
1704418156
其中,rq是(正面,正面)的概率,r(l-q)是(正面,背面)的概率,如此等等。[14]由于参与者1的期望收益在2-4q>0时随r递增;在2-4q<0时随r递减,则如果q<1/2,参与者1的最优反应为r=l(即出正面);如果q>1/2,参与者1的最优反应为r=0(即出背面),如图1.3.3所示r*(q)两段水平虚线。这一表述比上面非常相近的表述条件要强:那里我们只考虑纯战略,并发现如果q<1/2,正面为最优纯战略,如果q>1/2,背面为最优纯战略;这里我们考虑所有的纯战略和混合战略,同样发现如果q<1/2,正面是所有战略(包含纯战略和混合战略)中的最优选择,如果q>1/2,背面是所有战略中最优的。
1704418157
1704418158
1704418159
1704418160
1704418161
图1.3.3
1704418162
1704418163
当q=1/2时,参与者对(q,1-q)最优反应的性质有所变化。前面已经提到,在q=l/2时,参与者1选择纯战略正面或背面是无差异的。而且,因为参与者1在(1.3.1)中的期望收益在q=1/2时与r无关,所有混合战略(r,1-r)对1都是无差异的。也就是说,当q=1/2时,对于0到1之间的任何r,混合战略(r,1-r)都是(q,1-q)的最优反应。那么,r*(1/2)就是[0,1]间的整个区间,即图1.3.3所示r*(q)中间的竖线段。在第1.2.A节分析古诺模型时,我们称ri(qj)为企业i的最优反应函数。在这里,因为存在一个q的值,使r*(q)有不止一个解,我们称r*(q)为参与者1的最优反应对应(best-response correspondence)。
1704418164
1704418165
为在更为一般的条件下推导出参与者i对参与者j混合战略的最优反应,进一步给出扩展的纳什均衡的正式定义,我们首先分析两个参与者的情况,从而可以通过最简单的方式说明主要思想。令J表示S1中包含纯战略的个数,K表示S2包含纯战略的个数,则S1={s11,…,s1J},S2={s21,…,s2K},我们用s1j和s2k分别表示S1、S2中任意一个纯战略。
1704418166
1704418167
如果参与者1推断参与者2将以(Ρ21,…,Ρ2k)的概率选择战略(s21,…,Ρ2k),则参与者1选择纯战略s1j的期望收益为:
1704418168
1704418169
1704418170
1704418171
[
上一页 ]
[ :1.704418122e+09 ]
[
下一页 ]