打字猴:1.7023766e+09

1702376600

1702376601 这篇文章是关于博弈论的。匈牙利裔的伟大数学家约翰·冯·诺依曼于1928年发表了他关于博弈论的第一篇论文，虽然在他之前也有别人提出过类似的概念，但多数历史学家认为，冯·诺依曼才是开创这一领域并将其发扬光大的人。后来，曾遭到纳粹迫害而来到美国避难的奥地利经济学家奥斯卡·莫根施特恩（Oskar Morgenstern），也在这一领域作出了贡献。在他的帮助下，冯·诺依曼对博弈论进行了完善，并成功地将其应用于经济领域。利用博弈论的方法，冯·诺依曼对美苏之间的冷战行为进行了建模。他的这一方法广为他人所用，比如著名的兰德公司（RAND）。兰德（研发）公司成立于1945年12月，是最早出现的智囊机构，最初是由美国空军和国防承包商共同发起的一个RAND项目，目的是针对那些难以回答的问题找出答案。实际上，冯·诺依曼就是兰德公司的一名顾问。

1702376602

1702376603 在演讲中，卡尔向我们讲述了对于“囚徒困境”的最新研究进展。囚徒困境是一个十分有趣的博弈，于1950年由梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）共同设计，这两人恰恰就供职于加州圣莫尼卡的兰德公司。卡尔对此很感兴趣，设计这一博弈的发明者也意识到，作为一个强大的数学工具，囚徒困境很好地模拟了人类生活中最重要的一种斗争——关于冲突与合作、个人利益与集体利益之间的斗争。

1702376604

1702376605 这一难题之所以被命名为囚徒困境，是因为在它的经典形式中设计的是如下场景：假设你和你的同伙都已被警方捉拿归案，囚禁起来，而且正面临一项重罪控诉。检方对你们俩分头进行审讯，并各自提供一次选择的机会。这个选择机会正是囚徒困境的核心：如果某人充当背叛者，指控另一人的罪行，而与此同时，另一人保持沉默（不发起指控），那么背叛者坦白从宽，其刑期将减至1年，因为他揭发了同伙，使同伙获罪；而保持沉默的同伙则将面临4年的监禁。如果你们俩都保持沉默，相互合作，互不揭发，由于检方控诉重罪的证据不足，你们的审判结果会相对较轻，将分别获得两年的刑期。还有一种结果是，你们俩都背叛对方，相互揭发，则都会被治以重罪，但考虑到都有坦白的表现，将分别处以3年的刑期。

1702376606

1702376607 在实际生活中，你可以发现从囚徒困境引申出来的无数变形，例如不同的环境、不同的惩罚和奖赏、不同的囚禁方式细节，等等。但无论形式如何变化，其中心思想都可以用一张选择表——回报矩阵来表示（见表Y—1）。这个两行两列的矩阵可以概括囚徒困境的所有4种结果，也能概括日常生活中各种紧张微妙的局面。

1702376608

1702376609

1702376610

1702376611

1702376612 我们先看看回报矩阵的上面一行：你们俩都合作，每人获刑两年，记为-2，代表你们将失去自由的年头。你合作，而同伙背叛，你获刑 4年，他获刑1年。下面一行则描述了其他两个可能的选项：你背叛，而同伙合作，你获刑1年，他获刑4年。你们俩都背叛，每人获刑3年。从纯粹自私的观点来看，对你而言最好的结果是第三种情况，其次是第一种、第四种，而第二种情况是最差的。对你的同伙而言，第二种情况最好，然后分别是第一、第四和第三种情况。

1702376613

1702376614 假设你自己是一个理性而自私、事事争第一的人，你会怎么做呢？你大概会这样推理：你的同伙要么背叛，要么合作。如果他背叛，你也应该背叛，从而避免对你最坏的结果。如果他合作，你就应该背叛，从而获得对你最有利的结果，获刑最短。因此，无论你的同伙怎么做，你的最佳选择都是背叛。

1702376615

1702376616 在回报矩阵所定义的这样一种博弈里，背叛是一种优势策略。在博弈论中，优势策略的意思是说，无论对手采用何种策略，这个策略永远是最佳的。这并不难理解：如果你们俩都合作，你获刑两年，但如果你此时改为背叛，则只需1年。如果对方背叛而你守口如瓶，你将获刑4年，此时如果你改口背叛，则只需3年。因此，不管对方如何，你都最好采取背叛策略。

1702376617

1702376618 不过，在上述推理链条中存在一个漏洞。那就是你的同伙不是傻子，他跟你一样，也在进行同样的推理，也会得出同样的结论。这样导致的结果就是，你们两人都背叛，各自入狱3年。这里的困境就在于，如果你们俩都采用对自己最佳、最理性的优势策略，所获得的结果还不如你们同时保持沉默！你们都得到了第三等的结果，但如果你们都合作的话，就可以获得第二等的结果。

1702376619

1702376620 看起来是不是很无奈？这就是囚徒困境。只要你们相互信任、彼此合作，就能比自私自利获得更好的结果。借助这一思考工具，我们可以更清晰地领会合作的意义：一方付出代价让另一方获利。在囚徒困境中，如果双方都合作，就放弃了各自最优的结果——1年刑期，而获得了次优的结果。但跟双方都背叛相比，这仍然是一个不错的选择。

1702376621

1702376622 囚徒困境的形成，很大程度上取决于矩阵中合作与背叛所对应的利益安排。通过对各种选择所对应回报价值的大小进行排列，可以对囚徒困境进行明确定义：R（Reward）是双方都合作时所获得的利益，S（Sucker）是一方合作、另一方背叛时合作方的损失，T（Temptation）是对方合作时己方背叛所获得的好处，P（Punishment）是双方背叛时得到的惩罚。我们来详细讨论这些概念。双方合作的回报价值R明显要高于双方背叛的惩罚P。然而当一方合作、一方背叛时，背叛者获得最高的回报T，而不幸的合作方则要接受最差的结果——傻子回报S。总的来说，当T > R > P > S时，就形成了囚徒困境。就这个基本博弈来说，我们也可以对各种回报以其他顺序进行排列，从而得到不同的合作困境。但在所有这些困境之中，囚徒困境是最难解决的，你可以将其视为合作的终极困境。

1702376623

1702376624 在日常生活中，类似的困境总会以这样那样的形式发生在我们身上。当跟我竞争升职机会的同事休假时，我愿意帮他完成他分内的工作吗？两个互为竞争对手的公司各自定价时，是应该串通一气以获得最大的利润，还是应该竞相降价以抢夺市场？还有超级大国之间、邻国之间，甚至不同物种之间的军备竞赛，都是囚徒困境的很好的例子。如果相互竞争的国家之间能够达成合作，避免军备竞赛，这样对大家都有好处。然而，对每一个国家来说，它们各自的优势策略却都是大幅加强本方的军备。

1702376625

1702376626

1702376627

1702376628

1702376629 超级合作者 [:1702376296]

1702376630 超级合作者我与“囚徒困境”的不解之缘

1702376631

1702376632 当我在阿尔卑斯的小屋里第一次接触到囚徒困境理论时，立刻就被它深深地吸引住了，并在之后的几十年中深陷其中，难以自拔。在那个时候，卡尔也成了我的“囚徒”，人身自由受到我的限制，因为他没有任何交通工具，必须搭我的车回维也纳。第二天，我们在回去的路上还一直在讨论囚徒困境。这一趟搭乘之后，我并没有“释放”卡尔，而是始终将他保持在我的视线以内。不久，我就开始在维也纳大学数学学院念博士了。这个学院曾经涌现过许多了不起的人物，包括著名物理学家路德维希·玻尔兹曼（Ludwig Boltzmann）、逻辑学家库尔特·哥德尔（Kurt Gödel），还有基因之父格雷戈尔·孟德尔（Gregor Mendel）。

1702376633

1702376634 攻读博士期间，我经常跟卡尔在当地的咖啡馆见面讨论，那里有着活跃的学术讨论气氛。哥德尔曾在那里发表不完备定理，玻尔兹曼曾在那里研究熵，路德维希·维特根斯坦（Ludwig Wittgenstein）也曾在那里挑战维也纳学派—— 一群经常聚集在一起讨论数学与哲学问题的知识分子。有一天，我和卡尔在中央咖啡馆喝咖啡，这个咖啡馆有着漂亮的拱形屋顶和大理石柱子，列夫·达维多维奇·托洛茨基（Trotsky）就是在那里谋划了俄国的十月革命。

1702376635

1702376636 我们一边啜饮着浓浓的咖啡，一边对囚徒困境展开讨论，并且对这个问题的微妙之处有了全新的发现。这个问题曾让许多聪明的人陷入其中，而我们当时并没想到，在之后的二十年中，我们会针对囚徒困境设计出新的数学研究方法，我们会利用计算机建立起群体模型、研究不同群体如何进化，分析并揭示囚徒困境的解决机制。更没有想到，我还将建立横跨牛津、普林斯顿和哈佛三所大学的团队，与来自世界各地的数学家、生物学家、化学家、经济学家和医生进行合作，共同研究这些机制的运行方式，分析它们所蕴含的更广泛含义。

1702376637

1702376638 有些科学家认为，囚徒困境是关于生物行为、进化和生命的深刻隐喻。而另一些人则认为，相对于真实的社会与生物世界而言，囚徒困境还过于简单，很多细微因素还未予考虑。这两种观点我都同意。囚徒困境本身并不是理解生命的钥匙，我们必须把它放在进化的大背景下来观察，才能获得关于生物世界的启示。

1702376639

1702376640 进化只能发生在由不断繁殖的个体所组成的种群中。在这些种群里，繁衍过程中的DNA复制错误将导致突变，而突变后的种群会以不同的速度进行繁衍，一些突变种群比另一些种群更能适应某一种环境。不同的繁衍速度导致了选择，快速繁殖的个体被大自然所选择，并繁荣发展。在这个背景下来考虑囚徒困境的回报和代价，可以映射为进化科学家眼中的“适应性”（也可视为繁殖速度）。那么，囚徒困境中的“合作”就可以表述为：如果我帮助你，就会降低我的适应性，并提高你的适应性。

1702376641

1702376642 现在，真正有意思的事情来了。当以进化的观点来思考囚徒困境的时候，我们有了一个重要发现：自然选择似乎并不支持囚徒困境基本模式中的合作行为，而且从本质上看，自然选择还会削弱我们的合作能力。为什么呢？因为在数学家所谓的均匀混合种群中，任意两个个体的相遇机会均等，合作者的适应性总是低于背叛者，也就是说，合作者的生存机会更小。随着合作者相继死去，背叛者的数量在自然选择的过程中会越来越多，最后，合作者完全灭绝。这太不可思议了！因为完全由合作者组成的种群，其平均适应性要比背叛者种群的适应性更高。那么自然选择实际上破坏了种群整体的利益，导致无法获得群体最优的结果。

1702376643

1702376644 如果说自然选择是有利于合作的，那么某种合作进行机制就必不可少。我们相信这种机制的确存在，因为周围有许许多多的证据表明自然选择偏爱于合作：从高大的白蚁丘，到体育场摇滚音乐会，以及蜂拥往返于市区和郊区间的上班族，都是关于合作的最好的例子。千百万年来，无论是细胞、微生物还是动物，都经历了一系列基因进化的过程。最终，大自然还是青睐合作者。

1702376645

1702376646 同时，这些合作机制也推动了文化的进化，即我们在行为、穿着、说话、艺术创作等方方面面的变化。从这一角度看，进化更容易得到理解：我们从彼此身上学习，并据此改变自己的行为方式。这种进化所需要的时间周期相对更短，例如，在人类种族内部，人们会学习与周围环境打交道的各种策略和技巧，无论是宗教、造船术还是木匠活。合作对于文化的影响是巨大的，而且在我看来，正因为有了合作，生活才如此美丽动人。

1702376647

1702376648

1702376649

[ 上一页 ] [ :1.7023766e+09 ] [ 下一页 ]