打字猴:1.70463985e+09

1704639850 2．最优反应的定义

1704639851

1704639852

1704639853 给定所有别的游戏者所选的策略s-i，游戏者i的最优反应，记为是指能给他带来最大收益的策略，这便是

1704639854

1704639855

1704639856

1704639857

1704639858 如（10.2）式中的不等式变为严格不等式，则“最优反应”就是严格的最优反应。

1704639859

1704639860 二、纳什均衡

1704639861

1704639862 有了最优反应的概念，我们就可以定义纳什均衡。

1704639863

1704639864 1．纳什均衡的定义

1704639865

1704639866

1704639867

1704639868 一个策略组合被称为纳什均衡，如果别的游戏者不背离这一组合，就没有人会背离他自己的最优反应换言之，对于所有的i

1704639869

1704639870

1704639871

1704639872

1704639873 这就是说，当参与博弈的每一个游戏者都选择了自己的最优反应策略时，并且这些最优反应形成一个组合，便形成了纳什均衡。由此看来，古诺均衡是一个纳什均衡，因为两个生产者都选择了自己的最优反应，并且这两条反应线相交，形成了一个策略组合。

1704639874

1704639875 2．纳什均衡的另一种表达式

1704639876

1704639877 如果我们记Bi（s-i）为给定s-i时游戏者i的最优反应集，即

1704639878

1704639879

1704639880

1704639881

1704639882

1704639883 我们有时称集值函数Bi为游戏者i的最优反应函数。显然，Nash均衡是一个策略组合使得

1704639884

1704639885

1704639886

1704639887

1704639888

1704639889

1704639890

1704639891 式（10.5）实质上启示我们如何去找纳什均衡：第一步，对于所有的游戏者，找出其最优反应策略；然后，把所有的集中对应起来，找出

1704639892

1704639893 3．举例

1704639894

1704639895 我们回头再分析例1（囚犯的困境）。见表10.1。

1704639896

1704639897 如果A选择“不揭发”，则对B而言，“最优反应”是选择“揭发”，因为6>5。但是，如果B选择“揭发”，对A而言，“最优反应”则是选择“揭发”，因0>-1。当A选择“揭发”时，B的“最优反应”应是选择“揭发”。所以，只有（揭发，揭发）才是最优反应的组合，才是纳什均衡。

1704639898

1704639899 在例2里，给定B与C都选择1，A的最优反应必定是选择1，因3>2>1。给定A与B都选定1，则对C而言，最优反应便是1，因在表10.3的三个盒子的第1格中，第1个盒子图中的第1格对C而言收益最高。同理，给定A与C都选择1，B的最优反应是“1”，所以，（1，1，1）是一个纳什均衡。同理，（2，2，2）也是一个纳什均衡，（3，3，3）也是一个纳什均衡。例2说明，在一个博弈里，可能有多个纳什均衡。纳什均衡有可能不惟一。

[ 上一页 ] [ :1.70463985e+09 ] [ 下一页 ]