1701315181
石头剪刀布博弈心理学 什么是帕累托最优?
1701315182
1701315183
~囚徒困境中的帕累托最优①~
1701315184
1701315185
在博弈论中,还有“帕累托支配”和“帕累托最优”两个术语。它们是很重要的概念,但也比较复杂。在这里,我想对这两个概念稍微多讲几句。
1701315186
1701315187
在囚徒困境的博弈中,两个局中人“坦白”对“坦白”的策略组合是纳什均衡,也是两个人的最优反应。可是,采取“坦白”对“坦白”的策略组合,双方的收益都只有1。而如果采取“沉默”对“沉默”的策略组合,则两个局中人的收益都是3,明显要高于“坦白”对“坦白”的策略组合。这种情况下,我们就称“沉默”对“沉默”的策略组合帕累托支配着“坦白”对“坦白”的策略组合。
1701315188
1701315189
如果没有哪个策略组合可以超越帕累托支配策略组合Z,那么,策略组合Z就叫作帕累托最优,或者叫作帕累托效率。换句话说,就是“为了让某人的状态变得更好,就不得不牺牲其他人的状态”。
1701315190
1701315191
虽然帕累托支配和帕累托效率说的是一回事,但这两种说法都容易招致误解。帕累托是著名经济学家,所以有关帕累托的一些术语在经济领域应用比较多。一提到“最优”,我们就能想到“最好”“最合适”等概念,但是,帕累托最优并不是对所有参与者来说都是最好的选择。虽然名叫帕累托最优,但并不是对其他所有策略都处于帕累托支配地位。另外,帕累托最优也叫作帕累托效率,不过,这里的“效率”和“生产效率”“劳动效率”等“效率”存在较大的差异。帕累托效率主要是在考虑个人的需求、利益时使用的工具。
1701315192
1701315193
1701315194
1701315195
1701315196
注:①日语中“调色盘”和“帕累托”同音。
1701315197
1701315198
~囚徒困境中的帕累托最优②~
1701315199
1701315200
下面我们一起来仔细分析一下囚徒困境中的帕累托最优。在囚徒困境的博弈中,“沉默”对“沉默”的策略组合支配着“坦白”对“坦白”的策略组合。那么,“沉默”对“沉默”的策略组合是不是帕累托最优呢?我们试着将“沉默”对“沉默”的策略组合转换成其他策略组合,结果发现,转换之后至少有一个局中人的收益下降了。比如,将“沉默”对“沉默”转换成“沉默”对“坦白”的时候,局中人B的收益从3变成了5,是变好了,可是局中人A的收益从3变成了0,变差了(牺牲了A的利益)。同样的道理,如果将“沉默”对“沉默”转换成“坦白”对“沉默”,那么这次B的收益就会变差。由此可见,“沉默”对“沉默”的策略组合是帕累托最优。
1701315201
1701315202
再来分析一下“沉默”对“坦白”的策略组合。如果将“沉默”对“坦白”的策略组合转换成“沉默”对“沉默”的策略组合,那么A的收益从0变成了3,是变好了,可是B的收益从5变成了3,是变差了。如果转换成“坦白”对“沉默”,那么A的收益从0变成了5,而B的收益则从5变成了0。如果转换成“坦白”对“坦白”的话,A的收益从0变成了1,而B的收益从5变成了1。换句话说,“沉默”对“坦白”的策略组合,可以说是“为了让某人的状态变得更好,就不得不牺牲其他人的状态”。也就是说,“沉默”对“坦白”的策略组合也是帕累托最优。同样的道理,“坦白”对“沉默”的策略组合如果转换成其他策略组合的话,也会牺牲某人的利益,因此这个策略组合也是帕累托最优。
1701315203
1701315204
综上所述,在囚徒困境的博弈中存在三个帕累托最优,分别是“沉默”对“沉默”的策略组合、“坦白”对“沉默”的策略组合以及“沉默”对“坦白”的策略组合。说到这里,可能大家已经对“最优”感到困惑了,怎么会同时有好几个最优呢?在博弈的世界里,最优确实不一定只有一个。
1701315205
1701315206
1701315207
1701315208
1701315209
~囚徒困境中的帕累托最优③~
1701315210
1701315211
我们来看一个具体的例子。有一位祖父给了两个孙子1万日元,叫他们自己去分这笔钱。如果兄弟二人平均分配,那就是a=(5000日元,5000日元)。括号里左边是哥哥分到的钱,右边是弟弟分到的钱。如果哥哥恃强凌弱,宣布自己独吞那1万日元的话,分配方案就是b=(1万日元,0日元)。如果哥哥心疼弟弟,知道弟弟缺钱,想多分他一点儿,那么分配方案就是c=(4000日元,6000日元)。上述这些分配方案,都是帕累托最优。帕累托最优中没有平等的概念。因此,方案b也是帕累托最优。但是,如果这样分配,z=(4000日元,4000日元),1万日元没有分完,那这种分配方案就不是帕累托最优。兄弟二人分1万日元,假设哥哥分得的钱用y表示,弟弟分得的钱用x表示,那么,只要符合如下等式的分配方案,就都可以称为帕累托最优。
1701315212
1701315213
y=1万日元-x
1701315214
1701315215
帕累托最优(帕累托效率)经常被人与纳什均衡混为一谈。其实二者存在较大差别。简单地说,帕累托最优是最大限度地发挥整体效益的状态,而纳什均衡是个人满意度最大的状态。在有些博弈中,帕累托最优和纳什均衡是一致的,但也有些博弈中,两者是不一致的,比如囚徒困境的博弈。在下一小节中,我就详细讲一讲帕累托最优和纳什均衡的差别。
1701315216
1701315217
1701315218
1701315219
1701315220
1701315221
1701315222
1701315224
石头剪刀布博弈心理学 帕累托最优与纳什均衡
1701315225
1701315226
~两者一致的案例与两者不一致的案例~
1701315227
1701315228
假设有一对情侣A和B,他们住在一起。星期六,他们都不用上班,很想出去玩,可是天公不作美,偏偏下起了雨。虽然两人都想出去玩,可是下雨天出去的话,也玩不开心。如果一个人单独出去玩,收益是-3。如果一个人单独在家的话,收益就是1。不过,只要两个人在一起,不管出去玩还是宅在家,都会很开心,所以两人同时行动的时候,收益值要在原来的基础上再加3。
1701315229
[
上一页 ]
[ :1.70131518e+09 ]
[
下一页 ]