打字猴:1.70463968e+09
1704639680
1704639681 游戏的顺序是指在什么时候该谁下棋?游戏的次序可分为“同时”(simultaneously)与“序列”(sequential)。“同时”是指游戏者同时决定自己的行动,“序列”顺序得明确规定谁先行,谁后走。
1704639682
1704639683 四、定义(信息集(information set))
1704639684
1704639685 信息集是游戏者在博弈的某一特定时点上关于不同变量的取值的全部知识之和。如果游戏者在该时点上考虑的是若干个变量,则游戏者认为可能出现的每个变量的若干种可能值都属于信息集的要素。
1704639686
1704639687 五、定义(游戏者的策略(player’s strategy))
1704639688
1704639689 游戏者的策略是指在博弈的每一环上,游戏者的行事规则,即按什么规则到行动集中去选择行动。
1704639690
1704639691 注意,策略不等同于行动。策略是指,如果出现了什么情况,如果对手采取了什么行动,那么,我该采取什么行动。
1704639692
1704639693 【定义】 游戏者的策略集或策略空间(player’s strategy set or strategy space):si={si}是游戏者i所有策略的集合。
1704639694
1704639695 【定义】 策略组合(strategy combination):记为s=(s1,s2,…,sn),这是指,如果有n个游戏者参与了一个博弈,那么,每个游戏者只取一个策略,n个策略的拼盘就构成一个特定的策略组合。
1704639696
1704639697 例如,在石油输出国组织里,沙特(s)在1998年的石油产量Qs,8,取决于世界市场对石油的需求(D),又取决于自己上一年的石油产量Qs,7,还取决于当年的竞争对手(others)的石油产量Qo,8。这样,沙特在石油产量的博弈里的行动,是“产量高”(H),与“产量低”(L),但其策略集为
1704639698
1704639699
1704639700
1704639701
1704639702 我们必须再次强调一下,行动与策略是有区别的:(1)行动是你可以采取的某种行动方式,只要可能,你都可以采取;策略是一种有条件的应对行动方案,即如形势那样,对手采取什么行动,我会采取什么行动。(2)行动是一种客观可能性,是可以观察到的;如下棋走到某一步时,你可发现对方只有几种下法,即有几个可能的行动,这是可观察到的。而策略是一种主观的、心理上的应变对策,你不可能观察到对手心中的策略,并不能见到他心中会设计好的应对的行动方案。
1704639703
1704639704 六、定义(游戏者的收益(player’s payoff))
1704639705
1704639706 (1)payoff是指游戏者在所有别的游戏者选择了策略之后,并在老天(自然)选择了以后,进行了博弈之后,带给游戏者的效用。
1704639707
1704639708 (2)或者是由游戏者与别的游戏者选择的策略的函数带给游戏者的预期效用。
1704639709
1704639710 收益(payoff)只是博弈带给游戏者的效用。收益不等于“结果”(outcome),博弈的结果包括了payoff,但还包括了别的要素。
1704639711
1704639712 七、定义(结果(outcome))
1704639713
1704639714 博弈的结果是指构模者在博弈进行了以后从行动、收益与别的变量的数值中取到的一组感兴趣的要素的集合。
1704639715
1704639716 例1:在下列“囚犯的困境”(prisoner’s dilemma)的博弈中,警察逮到两个嫌疑犯(这两人事实上是一起作案犯罪的),但是缺乏定罪的证据。于是,警察把这两个嫌疑犯分别关在不同的房子里,并分别对他俩指出:
1704639717
1704639718 你应该揭发你的同伴。如果你们之间谁也不愿揭发对方,则都会被监禁很久。如果你不揭发,而你的同伴揭发了你,则他会很快获释,而你会被重判。如果你揭发了他,而他没有揭发你,则你很快会获释,而他会被重判。如果你们双双坦白,虽会被判刑,但考虑到你们的坦白态度,我们会对你们都从轻发落。
1704639719
1704639720 下列的标准型就写出了上述博弈,见表10.1:
1704639721
1704639722 表10.1 囚犯的困境
1704639723
1704639724
1704639725
1704639726
1704639727 上述矩阵又称“收益矩阵”,该收益矩阵中的数字表达的是对应每一个策略组合,囚犯A与囚犯B各自会获得的效用。注意,这些数字不代表监禁的年数,而只表示博弈结果带给A或B的效用。在每一格里,左边的数字代表A所获的效用,右边的数字代表B的效用。所谓博弈的结果,这里有四个:
1704639728
1704639729 第一个结果是:A选择不揭发,B亦选择不揭发,警察无法定罪,两个嫌疑犯在监狱中呆了一些日子后就出狱了,这带给双方的效用各为5。
[ 上一页 ]  [ :1.70463968e+09 ]  [ 下一页 ]