打字猴:1.7046397e+09

1704639700

1704639701

1704639702 我们必须再次强调一下，行动与策略是有区别的：（1）行动是你可以采取的某种行动方式，只要可能，你都可以采取；策略是一种有条件的应对行动方案，即如形势那样，对手采取什么行动，我会采取什么行动。（2）行动是一种客观可能性，是可以观察到的；如下棋走到某一步时，你可发现对方只有几种下法，即有几个可能的行动，这是可观察到的。而策略是一种主观的、心理上的应变对策，你不可能观察到对手心中的策略，并不能见到他心中会设计好的应对的行动方案。

1704639703

1704639704 六、定义（游戏者的收益（player’s payoff））

1704639705

1704639706 （1）payoff是指游戏者在所有别的游戏者选择了策略之后，并在老天（自然）选择了以后，进行了博弈之后，带给游戏者的效用。

1704639707

1704639708 （2）或者是由游戏者与别的游戏者选择的策略的函数带给游戏者的预期效用。

1704639709

1704639710 收益（payoff）只是博弈带给游戏者的效用。收益不等于“结果”（outcome），博弈的结果包括了payoff，但还包括了别的要素。

1704639711

1704639712 七、定义（结果（outcome））

1704639713

1704639714 博弈的结果是指构模者在博弈进行了以后从行动、收益与别的变量的数值中取到的一组感兴趣的要素的集合。

1704639715

1704639716 例1：在下列“囚犯的困境”（prisoner’s dilemma）的博弈中，警察逮到两个嫌疑犯（这两人事实上是一起作案犯罪的），但是缺乏定罪的证据。于是，警察把这两个嫌疑犯分别关在不同的房子里，并分别对他俩指出：

1704639717

1704639718 你应该揭发你的同伴。如果你们之间谁也不愿揭发对方，则都会被监禁很久。如果你不揭发，而你的同伴揭发了你，则他会很快获释，而你会被重判。如果你揭发了他，而他没有揭发你，则你很快会获释，而他会被重判。如果你们双双坦白，虽会被判刑，但考虑到你们的坦白态度，我们会对你们都从轻发落。

1704639719

1704639720 下列的标准型就写出了上述博弈，见表10.1：

1704639721

1704639722 表10.1　囚犯的困境

1704639723

1704639724

1704639725

1704639726

1704639727 上述矩阵又称“收益矩阵”，该收益矩阵中的数字表达的是对应每一个策略组合，囚犯A与囚犯B各自会获得的效用。注意，这些数字不代表监禁的年数，而只表示博弈结果带给A或B的效用。在每一格里，左边的数字代表A所获的效用，右边的数字代表B的效用。所谓博弈的结果，这里有四个：

1704639728

1704639729 第一个结果是：A选择不揭发，B亦选择不揭发，警察无法定罪，两个嫌疑犯在监狱中呆了一些日子后就出狱了，这带给双方的效用各为5。

1704639730

1704639731 第二个结果是：A选择揭发，B则不揭发；payoff分别为：A得6，B得-1。

1704639732

1704639733 第三个结果是：A不揭发，B揭发A；A的效用是-1，B则获6。

1704639734

1704639735 第四个结果是：俩人都揭发对方，谁也没有获好处，payoff是每人都得零。

1704639736

1704639737 所以，“结果”代表的是博弈可能发生的结局。

1704639738

1704639739 要注意的是，“结果”不等于“策略组合”。有时，同一结果可以由不同的策略组合造成。

1704639740

1704639741 八、下定义（均衡（equilibrium））

1704639742

1704639743

1704639744 博弈中的均衡，记为是博弈中n个游戏者各自都采取了其最优策略而产生的一个策略组合。

1704639745

1704639746 这就是说，均衡是在策略集｛s1，s2，…，sn｝上定义的，但不是随便取的一个策略组合，而是由每个游戏者的最优策略组成的一个组合。由均衡所产生的结果叫均衡结果。

1704639747

1704639748 微观经济学十八讲 [:1704632855]

1704639749 第二节　策略博弈与占优

[ 上一页 ] [ :1.7046397e+09 ] [ 下一页 ]