打字猴:1.701315167e+09
1701315167
1701315168 看到有人增加饲养的牛的数量之后,其他村民都纷纷效仿。10个村民每人增加了1头牛。结果,每个村民的牛的总价值为90万日元×11头=990万日元。而维持100头牛的时候,每个村民所拥有的牛的总价值是1000万日元。由此可见,增加牛的数量之后,每个村民的牛的总价值反而缩水了。第一个增加牛的数量的村民一看这种情况,就着急了,赶紧又增加了1头牛,这样一来,他的牛的总价值就变成了89万日元×12头=1068万日元。之后,其他村民也纷纷效仿,结果牧草地就被超出负荷的牛啃光了,变成了沙地,谁也无法继续养牛了。
1701315169
1701315170 这种博弈模型被称为“共有地的悲剧”。在一个集体中,如果所有人能相互协调后再采取行动,那么可以保证全体人员都受益。但是如果大家都抱有利己主义思想,只为追求个人利益而采取行动的话,那么最终所有人都会无利可图。
1701315171
1701315172
1701315173
1701315174
1701315175 注:①出自漫画《进击的巨人》。
1701315176
1701315177
1701315178
1701315179
1701315180 石头剪刀布博弈心理学 [:1701313752]
1701315181 石头剪刀布博弈心理学 什么是帕累托最优?
1701315182
1701315183 ~囚徒困境中的帕累托最优①~
1701315184
1701315185 在博弈论中,还有“帕累托支配”和“帕累托最优”两个术语。它们是很重要的概念,但也比较复杂。在这里,我想对这两个概念稍微多讲几句。
1701315186
1701315187 在囚徒困境的博弈中,两个局中人“坦白”对“坦白”的策略组合是纳什均衡,也是两个人的最优反应。可是,采取“坦白”对“坦白”的策略组合,双方的收益都只有1。而如果采取“沉默”对“沉默”的策略组合,则两个局中人的收益都是3,明显要高于“坦白”对“坦白”的策略组合。这种情况下,我们就称“沉默”对“沉默”的策略组合帕累托支配着“坦白”对“坦白”的策略组合。
1701315188
1701315189 如果没有哪个策略组合可以超越帕累托支配策略组合Z,那么,策略组合Z就叫作帕累托最优,或者叫作帕累托效率。换句话说,就是“为了让某人的状态变得更好,就不得不牺牲其他人的状态”。
1701315190
1701315191 虽然帕累托支配和帕累托效率说的是一回事,但这两种说法都容易招致误解。帕累托是著名经济学家,所以有关帕累托的一些术语在经济领域应用比较多。一提到“最优”,我们就能想到“最好”“最合适”等概念,但是,帕累托最优并不是对所有参与者来说都是最好的选择。虽然名叫帕累托最优,但并不是对其他所有策略都处于帕累托支配地位。另外,帕累托最优也叫作帕累托效率,不过,这里的“效率”和“生产效率”“劳动效率”等“效率”存在较大的差异。帕累托效率主要是在考虑个人的需求、利益时使用的工具。
1701315192
1701315193
1701315194
1701315195
1701315196 注:①日语中“调色盘”和“帕累托”同音。
1701315197
1701315198 ~囚徒困境中的帕累托最优②~
1701315199
1701315200 下面我们一起来仔细分析一下囚徒困境中的帕累托最优。在囚徒困境的博弈中,“沉默”对“沉默”的策略组合支配着“坦白”对“坦白”的策略组合。那么,“沉默”对“沉默”的策略组合是不是帕累托最优呢?我们试着将“沉默”对“沉默”的策略组合转换成其他策略组合,结果发现,转换之后至少有一个局中人的收益下降了。比如,将“沉默”对“沉默”转换成“沉默”对“坦白”的时候,局中人B的收益从3变成了5,是变好了,可是局中人A的收益从3变成了0,变差了(牺牲了A的利益)。同样的道理,如果将“沉默”对“沉默”转换成“坦白”对“沉默”,那么这次B的收益就会变差。由此可见,“沉默”对“沉默”的策略组合是帕累托最优。
1701315201
1701315202 再来分析一下“沉默”对“坦白”的策略组合。如果将“沉默”对“坦白”的策略组合转换成“沉默”对“沉默”的策略组合,那么A的收益从0变成了3,是变好了,可是B的收益从5变成了3,是变差了。如果转换成“坦白”对“沉默”,那么A的收益从0变成了5,而B的收益则从5变成了0。如果转换成“坦白”对“坦白”的话,A的收益从0变成了1,而B的收益从5变成了1。换句话说,“沉默”对“坦白”的策略组合,可以说是“为了让某人的状态变得更好,就不得不牺牲其他人的状态”。也就是说,“沉默”对“坦白”的策略组合也是帕累托最优。同样的道理,“坦白”对“沉默”的策略组合如果转换成其他策略组合的话,也会牺牲某人的利益,因此这个策略组合也是帕累托最优。
1701315203
1701315204 综上所述,在囚徒困境的博弈中存在三个帕累托最优,分别是“沉默”对“沉默”的策略组合、“坦白”对“沉默”的策略组合以及“沉默”对“坦白”的策略组合。说到这里,可能大家已经对“最优”感到困惑了,怎么会同时有好几个最优呢?在博弈的世界里,最优确实不一定只有一个。
1701315205
1701315206
1701315207
1701315208
1701315209 ~囚徒困境中的帕累托最优③~
1701315210
1701315211 我们来看一个具体的例子。有一位祖父给了两个孙子1万日元,叫他们自己去分这笔钱。如果兄弟二人平均分配,那就是a=(5000日元,5000日元)。括号里左边是哥哥分到的钱,右边是弟弟分到的钱。如果哥哥恃强凌弱,宣布自己独吞那1万日元的话,分配方案就是b=(1万日元,0日元)。如果哥哥心疼弟弟,知道弟弟缺钱,想多分他一点儿,那么分配方案就是c=(4000日元,6000日元)。上述这些分配方案,都是帕累托最优。帕累托最优中没有平等的概念。因此,方案b也是帕累托最优。但是,如果这样分配,z=(4000日元,4000日元),1万日元没有分完,那这种分配方案就不是帕累托最优。兄弟二人分1万日元,假设哥哥分得的钱用y表示,弟弟分得的钱用x表示,那么,只要符合如下等式的分配方案,就都可以称为帕累托最优。
1701315212
1701315213 y=1万日元-x
1701315214
1701315215 帕累托最优(帕累托效率)经常被人与纳什均衡混为一谈。其实二者存在较大差别。简单地说,帕累托最优是最大限度地发挥整体效益的状态,而纳什均衡是个人满意度最大的状态。在有些博弈中,帕累托最优和纳什均衡是一致的,但也有些博弈中,两者是不一致的,比如囚徒困境的博弈。在下一小节中,我就详细讲一讲帕累托最优和纳什均衡的差别。
1701315216
[ 上一页 ]  [ :1.701315167e+09 ]  [ 下一页 ]