打字猴:1.70103356e+09
1701033560 用博弈的思维看世界 二、囚犯困境的定义与原因分析
1701033561
1701033562 1.定义
1701033563
1701033564 在一个二人双策略博弈中(见表5.4),如果满足以下两个条件,那么其占优策略均衡就构成了囚犯困境。
1701033565
1701033566 (1)双方都有占优策略,即:
1701033567
1701033568 a1 >a3 ,a2 >a4 ,b1 >b2 ,b3 >b4
1701033569
1701033570 在a1 >a3 ,a2 >a4 的条件下,张三选择背叛是占优策略;在b1 >b2 ,b3 >b4 的条件下,李四选择背叛是占优策略。
1701033571
1701033572 (2)存在一个合作解,使双方的收益都优于其在占优策略均衡下的收益,即:
1701033573
1701033574 a1 a4 ,b1 b4
1701033575
1701033576 如果双方能够选择合作,本可以得到更好的结果。
1701033577
1701033578 表5.4 一般条件下的囚犯困境
1701033579
1701033580
1701033581
1701033582
1701033583 在一个二人双策略对称博弈中(见表5.5),如果满足以下条件:P>S>R>T,那么其占优策略均衡(R,R)就构成了囚犯困境。
1701033584
1701033585 表5.5 对称条件下的囚犯困境
1701033586
1701033587
1701033588
1701033589
1701033590 无论是收益对称博弈还是收益不对称博弈,囚犯困境告诉人们的是:我们原本可以有更好的结局,然而实际得到的却往往是最差的结局。
1701033591
1701033592 2.原因分析
1701033593
1701033594 对于出现囚犯困境的原因,人们一般理解为是个体对于自身利益的追求。在表5.2中,每个囚犯选择坦白的目的是为了自己能够少坐牢。如果每个囚犯不是为了自己的利益考虑,而是能够为别人的利益考虑,哪怕自己多坐牢也要让对方先出去,那么,无论对方选择什么,自己都会选择抗拒,最后的结果就是(抗拒、抗拒),两个人都会得到最好的结果。或许,这就是所谓的困境:每个人都想少坐牢,选择了坦白,结果多坐牢;每个人都想多坐牢,选择了抗拒,反而可以少坐牢。真乃“事与愿违”!
1701033595
1701033596 如果人们把囚犯困境的原因归结为囚犯对自身利益的追求,那么,要想避免出现囚犯困境,就应该把囚犯们改造成“毫不利己、专门利人”的人,也就是说,要改变的是“人性”。从延安时期的白求恩、张思德,到解放战争时期的董存瑞和抗美援朝的黄继光、邱少云,再到新中国成立后不久的焦裕禄、雷锋,以及改革开放之后的孔繁森、牛玉儒、任长霞等,众多让几代中国人耳熟能详的模范人物最大的人格魅力,就是他们都具有无私奉献的精神。然而,要把13亿中国人中的大多数都改造成和这些模范人物一样,是不可能的。表面上看,囚犯对自身利益的追求是导致囚犯困境的原因,其实真正的原因是:囚犯们在追求自身利益的同时,以更多地损害对方的利益为代价。
1701033597
1701033598 看表5.6中的例子,如果囚犯们面对的是真正的“坦白从宽、抗拒从严”,那么每个人选择占优策略所形成的占优策略均衡就是一个对双方来说最好的结局。
1701033599
1701033600 表5.6 真正的坦白从宽、抗拒从严
1701033601
1701033602
1701033603
1701033604
1701033605 表5.6与表5.2的区别在于:表5.2中,每个囚犯选择坦白所带来的收益增加是以对方收益的更多减少为代价的,即当B选择坦白时,A选择抗拒可以少坐4.5年牢,而对方会因此多坐0.5年牢;当B选择抗拒,A选择坦白可以少坐3年牢,而对方会因此多坐2年牢。而在表5.6中,每个囚犯选择坦白所带来的收益增加是以对方收益的较少减少为代价的,即当B选择坦白,A选择抗拒可以少坐4.5年牢,而对方会因此多坐0.5年牢;当B选择抗拒,A选择坦白可以少坐3年牢,而对方会因此多坐2年牢。这就是为什么在表5.2中,每个人的理性选择导致囚犯困境,而在表5.6中,每个人的理性选择导致的却是“囚犯乐境”的根本原因所在。这一点,对于我们后面要讨论的“如何走出囚犯困境”具有十分重要的意义。
1701033606
1701033607 当然,囚犯困境不要求囚犯每次选择都以更多地损人为代价,但是,其总的效果一定是这样的。表5.7中,当B选择坦白时,A选择坦白会让自己少坐4年牢,对方因此只需多坐2年牢,但是,当B选择抗拒时,A选择坦白会让自己少坐1年牢,对方却因此需要多坐5年牢。简单加总后,A通过坦白可以少坐5年牢,B因为A的坦白会多坐7年牢。相对于都抗拒,都坦白的结果是使双方各自都多坐了1年牢,总的是多坐了2年牢。
1701033608
1701033609 表5.7 另一种囚犯困境
[ 上一页 ]  [ :1.70103356e+09 ]  [ 下一页 ]