1704639850
2.最优反应的定义
1704639851
1704639852
1704639853
给定所有别的游戏者所选的策略s-i,游戏者i的最优反应,记为是指能给他带来最大收益的策略,这便是
1704639854
1704639855
1704639856
1704639857
1704639858
如(10.2)式中的不等式变为严格不等式,则“最优反应”就是严格的最优反应。
1704639859
1704639860
二、纳什均衡
1704639861
1704639862
有了最优反应的概念,我们就可以定义纳什均衡。
1704639863
1704639864
1.纳什均衡的定义
1704639865
1704639866
1704639867
1704639868
一个策略组合被称为纳什均衡,如果别的游戏者不背离这一组合,就没有人会背离他自己的最优反应换言之,对于所有的i
1704639869
1704639870
1704639871
1704639872
1704639873
这就是说,当参与博弈的每一个游戏者都选择了自己的最优反应策略时,并且这些最优反应形成一个组合,便形成了纳什均衡。由此看来,古诺均衡是一个纳什均衡,因为两个生产者都选择了自己的最优反应,并且这两条反应线相交,形成了一个策略组合。
1704639874
1704639875
2.纳什均衡的另一种表达式
1704639876
1704639877
如果我们记Bi(s-i)为给定s-i时游戏者i的最优反应集,即
1704639878
1704639879
1704639880
1704639881
1704639882
1704639883
我们有时称集值函数Bi为游戏者i的最优反应函数。显然,Nash均衡是一个策略组合使得
1704639884
1704639885
1704639886
1704639887
1704639888
1704639889
1704639890
1704639891
式(10.5)实质上启示我们如何去找纳什均衡:第一步,对于所有的游戏者,找出其最优反应策略;然后,把所有的集中对应起来,找出
1704639892
1704639893
3.举例
1704639894
1704639895
我们回头再分析例1(囚犯的困境)。见表10.1。
1704639896
1704639897
如果A选择“不揭发”,则对B而言,“最优反应”是选择“揭发”,因为6>5。但是,如果B选择“揭发”,对A而言,“最优反应”则是选择“揭发”,因0>-1。当A选择“揭发”时,B的“最优反应”应是选择“揭发”。所以,只有(揭发,揭发)才是最优反应的组合,才是纳什均衡。
1704639898
1704639899
在例2里,给定B与C都选择1,A的最优反应必定是选择1,因3>2>1。给定A与B都选定1,则对C而言,最优反应便是1,因在表10.3的三个盒子的第1格中,第1个盒子图中的第1格对C而言收益最高。同理,给定A与C都选择1,B的最优反应是“1”,所以,(1,1,1)是一个纳什均衡。同理,(2,2,2)也是一个纳什均衡,(3,3,3)也是一个纳什均衡。例2说明,在一个博弈里,可能有多个纳什均衡。纳什均衡有可能不惟一。
[
上一页 ]
[ :1.70463985e+09 ]
[
下一页 ]