打字猴:1.70131518e+09

1701315180 石头剪刀布博弈心理学 [:1701313752]

1701315181 石头剪刀布博弈心理学什么是帕累托最优？

1701315182

1701315183 ～囚徒困境中的帕累托最优①～

1701315184

1701315185 在博弈论中，还有“帕累托支配”和“帕累托最优”两个术语。它们是很重要的概念，但也比较复杂。在这里，我想对这两个概念稍微多讲几句。

1701315186

1701315187 在囚徒困境的博弈中，两个局中人“坦白”对“坦白”的策略组合是纳什均衡，也是两个人的最优反应。可是，采取“坦白”对“坦白”的策略组合，双方的收益都只有1。而如果采取“沉默”对“沉默”的策略组合，则两个局中人的收益都是3，明显要高于“坦白”对“坦白”的策略组合。这种情况下，我们就称“沉默”对“沉默”的策略组合帕累托支配着“坦白”对“坦白”的策略组合。

1701315188

1701315189 如果没有哪个策略组合可以超越帕累托支配策略组合Z，那么，策略组合Z就叫作帕累托最优，或者叫作帕累托效率。换句话说，就是“为了让某人的状态变得更好，就不得不牺牲其他人的状态”。

1701315190

1701315191 虽然帕累托支配和帕累托效率说的是一回事，但这两种说法都容易招致误解。帕累托是著名经济学家，所以有关帕累托的一些术语在经济领域应用比较多。一提到“最优”，我们就能想到“最好”“最合适”等概念，但是，帕累托最优并不是对所有参与者来说都是最好的选择。虽然名叫帕累托最优，但并不是对其他所有策略都处于帕累托支配地位。另外，帕累托最优也叫作帕累托效率，不过，这里的“效率”和“生产效率”“劳动效率”等“效率”存在较大的差异。帕累托效率主要是在考虑个人的需求、利益时使用的工具。

1701315192

1701315193

1701315194

1701315195

1701315196 注：①日语中“调色盘”和“帕累托”同音。

1701315197

1701315198 ～囚徒困境中的帕累托最优②～

1701315199

1701315200 下面我们一起来仔细分析一下囚徒困境中的帕累托最优。在囚徒困境的博弈中，“沉默”对“沉默”的策略组合支配着“坦白”对“坦白”的策略组合。那么，“沉默”对“沉默”的策略组合是不是帕累托最优呢？我们试着将“沉默”对“沉默”的策略组合转换成其他策略组合，结果发现，转换之后至少有一个局中人的收益下降了。比如，将“沉默”对“沉默”转换成“沉默”对“坦白”的时候，局中人B的收益从3变成了5，是变好了，可是局中人A的收益从3变成了0，变差了（牺牲了A的利益）。同样的道理，如果将“沉默”对“沉默”转换成“坦白”对“沉默”，那么这次B的收益就会变差。由此可见，“沉默”对“沉默”的策略组合是帕累托最优。

1701315201

1701315202 再来分析一下“沉默”对“坦白”的策略组合。如果将“沉默”对“坦白”的策略组合转换成“沉默”对“沉默”的策略组合，那么A的收益从0变成了3，是变好了，可是B的收益从5变成了3，是变差了。如果转换成“坦白”对“沉默”，那么A的收益从0变成了5，而B的收益则从5变成了0。如果转换成“坦白”对“坦白”的话，A的收益从0变成了1，而B的收益从5变成了1。换句话说，“沉默”对“坦白”的策略组合，可以说是“为了让某人的状态变得更好，就不得不牺牲其他人的状态”。也就是说，“沉默”对“坦白”的策略组合也是帕累托最优。同样的道理，“坦白”对“沉默”的策略组合如果转换成其他策略组合的话，也会牺牲某人的利益，因此这个策略组合也是帕累托最优。

1701315203

1701315204 综上所述，在囚徒困境的博弈中存在三个帕累托最优，分别是“沉默”对“沉默”的策略组合、“坦白”对“沉默”的策略组合以及“沉默”对“坦白”的策略组合。说到这里，可能大家已经对“最优”感到困惑了，怎么会同时有好几个最优呢？在博弈的世界里，最优确实不一定只有一个。

1701315205

1701315206

1701315207

1701315208

1701315209 ～囚徒困境中的帕累托最优③～

1701315210

1701315211 我们来看一个具体的例子。有一位祖父给了两个孙子1万日元，叫他们自己去分这笔钱。如果兄弟二人平均分配，那就是a=（5000日元，5000日元）。括号里左边是哥哥分到的钱，右边是弟弟分到的钱。如果哥哥恃强凌弱，宣布自己独吞那1万日元的话，分配方案就是b=（1万日元，0日元）。如果哥哥心疼弟弟，知道弟弟缺钱，想多分他一点儿，那么分配方案就是c=（4000日元，6000日元）。上述这些分配方案，都是帕累托最优。帕累托最优中没有平等的概念。因此，方案b也是帕累托最优。但是，如果这样分配，z=（4000日元，4000日元），1万日元没有分完，那这种分配方案就不是帕累托最优。兄弟二人分1万日元，假设哥哥分得的钱用y表示，弟弟分得的钱用x表示，那么，只要符合如下等式的分配方案，就都可以称为帕累托最优。

1701315212

1701315213 y=1万日元-x

1701315214

1701315215 帕累托最优（帕累托效率）经常被人与纳什均衡混为一谈。其实二者存在较大差别。简单地说，帕累托最优是最大限度地发挥整体效益的状态，而纳什均衡是个人满意度最大的状态。在有些博弈中，帕累托最优和纳什均衡是一致的，但也有些博弈中，两者是不一致的，比如囚徒困境的博弈。在下一小节中，我就详细讲一讲帕累托最优和纳什均衡的差别。

1701315216

1701315217

1701315218

1701315219

1701315220

1701315221

1701315222

1701315223 石头剪刀布博弈心理学 [:1701313753]

1701315224 石头剪刀布博弈心理学帕累托最优与纳什均衡

1701315225

1701315226 ～两者一致的案例与两者不一致的案例～

1701315227

1701315228 假设有一对情侣A和B，他们住在一起。星期六，他们都不用上班，很想出去玩，可是天公不作美，偏偏下起了雨。虽然两人都想出去玩，可是下雨天出去的话，也玩不开心。如果一个人单独出去玩，收益是-3。如果一个人单独在家的话，收益就是1。不过，只要两个人在一起，不管出去玩还是宅在家，都会很开心，所以两人同时行动的时候，收益值要在原来的基础上再加3。

1701315229

[ 上一页 ] [ :1.70131518e+09 ] [ 下一页 ]