1704639716
例1:在下列“囚犯的困境”(prisoner’s dilemma)的博弈中,警察逮到两个嫌疑犯(这两人事实上是一起作案犯罪的),但是缺乏定罪的证据。于是,警察把这两个嫌疑犯分别关在不同的房子里,并分别对他俩指出:
1704639717
1704639718
你应该揭发你的同伴。如果你们之间谁也不愿揭发对方,则都会被监禁很久。如果你不揭发,而你的同伴揭发了你,则他会很快获释,而你会被重判。如果你揭发了他,而他没有揭发你,则你很快会获释,而他会被重判。如果你们双双坦白,虽会被判刑,但考虑到你们的坦白态度,我们会对你们都从轻发落。
1704639719
1704639720
下列的标准型就写出了上述博弈,见表10.1:
1704639721
1704639722
表10.1 囚犯的困境
1704639723
1704639724
1704639725
1704639726
1704639727
上述矩阵又称“收益矩阵”,该收益矩阵中的数字表达的是对应每一个策略组合,囚犯A与囚犯B各自会获得的效用。注意,这些数字不代表监禁的年数,而只表示博弈结果带给A或B的效用。在每一格里,左边的数字代表A所获的效用,右边的数字代表B的效用。所谓博弈的结果,这里有四个:
1704639728
1704639729
第一个结果是:A选择不揭发,B亦选择不揭发,警察无法定罪,两个嫌疑犯在监狱中呆了一些日子后就出狱了,这带给双方的效用各为5。
1704639730
1704639731
第二个结果是:A选择揭发,B则不揭发;payoff分别为:A得6,B得-1。
1704639732
1704639733
第三个结果是:A不揭发,B揭发A;A的效用是-1,B则获6。
1704639734
1704639735
第四个结果是:俩人都揭发对方,谁也没有获好处,payoff是每人都得零。
1704639736
1704639737
所以,“结果”代表的是博弈可能发生的结局。
1704639738
1704639739
要注意的是,“结果”不等于“策略组合”。有时,同一结果可以由不同的策略组合造成。
1704639740
1704639741
八、下定义(均衡(equilibrium))
1704639742
1704639743
1704639744
博弈中的均衡,记为是博弈中n个游戏者各自都采取了其最优策略而产生的一个策略组合。
1704639745
1704639746
这就是说,均衡是在策略集{s1,s2,…,sn}上定义的,但不是随便取的一个策略组合,而是由每个游戏者的最优策略组成的一个组合。由均衡所产生的结果叫均衡结果。
1704639747
1704639749
第二节 策略博弈与占优
1704639750
1704639751
一、策略博弈的定义
1704639752
1704639753
策略博弈又称标准型博弈(normal form game),该博弈由三个要素构成:
1704639754
1704639755
(1)参与博弈的游戏者名单(a list of players, I={1,2,…,i,i+1,…,I});
1704639756
1704639757
(2)每一个游戏者的策略单(a list of strategies for i, Si={si},i=1,2,…,I);
1704639758
1704639759
(3)每一个策略组合所对应的收益单(a list of payoff),收益单上列出该策略组合带给每一个游戏者的收益。
1704639760
1704639761
例2:这是我们每一个人在孩童时玩过的游戏:石头、剪刀与布。如只有两人参与博弈,一人伸出拳头表示“石头”,另一个人伸出两个指头表示“剪刀”,则“石头顶破剪刀”。我们记获胜者的收益为1,输者的收益为-1。如果俩人出示的手势相同,则为平局,各得零分。类似地,我们可以得3×3收益矩阵。
1704639762
1704639763
表10.2 石头、布、剪刀的博弈
1704639764
1704639765
[
上一页 ]
[ :1.704639716e+09 ]
[
下一页 ]