打字猴:1.7023766e+09
1702376600
1702376601 这篇文章是关于博弈论的。匈牙利裔的伟大数学家约翰·冯·诺依曼于1928年发表了他关于博弈论的第一篇论文,虽然在他之前也有别人提出过类似的概念,但多数历史学家认为,冯·诺依曼才是开创这一领域并将其发扬光大的人。后来,曾遭到纳粹迫害而来到美国避难的奥地利经济学家奥斯卡·莫根施特恩(Oskar Morgenstern),也在这一领域作出了贡献。在他的帮助下,冯·诺依曼对博弈论进行了完善,并成功地将其应用于经济领域。利用博弈论的方法,冯·诺依曼对美苏之间的冷战行为进行了建模。他的这一方法广为他人所用,比如著名的兰德公司(RAND)。兰德(研发)公司成立于1945年12月,是最早出现的智囊机构,最初是由美国空军和国防承包商共同发起的一个RAND项目,目的是针对那些难以回答的问题找出答案。实际上,冯·诺依曼就是兰德公司的一名顾问。
1702376602
1702376603 在演讲中,卡尔向我们讲述了对于“囚徒困境”的最新研究进展。囚徒困境是一个十分有趣的博弈,于1950年由梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)共同设计,这两人恰恰就供职于加州圣莫尼卡的兰德公司。卡尔对此很感兴趣,设计这一博弈的发明者也意识到,作为一个强大的数学工具,囚徒困境很好地模拟了人类生活中最重要的一种斗争——关于冲突与合作、个人利益与集体利益之间的斗争。
1702376604
1702376605 这一难题之所以被命名为囚徒困境,是因为在它的经典形式中设计的是如下场景:假设你和你的同伙都已被警方捉拿归案,囚禁起来,而且正面临一项重罪控诉。检方对你们俩分头进行审讯,并各自提供一次选择的机会。这个选择机会正是囚徒困境的核心:如果某人充当背叛者,指控另一人的罪行,而与此同时,另一人保持沉默(不发起指控),那么背叛者坦白从宽,其刑期将减至1年,因为他揭发了同伙,使同伙获罪;而保持沉默的同伙则将面临4年的监禁。如果你们俩都保持沉默,相互合作,互不揭发,由于检方控诉重罪的证据不足,你们的审判结果会相对较轻,将分别获得两年的刑期。还有一种结果是,你们俩都背叛对方,相互揭发,则都会被治以重罪,但考虑到都有坦白的表现,将分别处以3年的刑期。
1702376606
1702376607 在实际生活中,你可以发现从囚徒困境引申出来的无数变形,例如不同的环境、不同的惩罚和奖赏、不同的囚禁方式细节,等等。但无论形式如何变化,其中心思想都可以用一张选择表——回报矩阵来表示(见表Y—1)。这个两行两列的矩阵可以概括囚徒困境的所有4种结果,也能概括日常生活中各种紧张微妙的局面。
1702376608
1702376609
1702376610
1702376611
1702376612 我们先看看回报矩阵的上面一行:你们俩都合作,每人获刑两年,记为-2,代表你们将失去自由的年头。你合作,而同伙背叛,你获刑 4年,他获刑1年。下面一行则描述了其他两个可能的选项:你背叛,而同伙合作,你获刑1年,他获刑4年。你们俩都背叛,每人获刑3年。从纯粹自私的观点来看,对你而言最好的结果是第三种情况,其次是第一种、第四种,而第二种情况是最差的。对你的同伙而言,第二种情况最好,然后分别是第一、第四和第三种情况。
1702376613
1702376614 假设你自己是一个理性而自私、事事争第一的人,你会怎么做呢?你大概会这样推理:你的同伙要么背叛,要么合作。如果他背叛,你也应该背叛,从而避免对你最坏的结果。如果他合作,你就应该背叛,从而获得对你最有利的结果,获刑最短。因此,无论你的同伙怎么做,你的最佳选择都是背叛。
1702376615
1702376616 在回报矩阵所定义的这样一种博弈里,背叛是一种优势策略。在博弈论中,优势策略的意思是说,无论对手采用何种策略,这个策略永远是最佳的。这并不难理解:如果你们俩都合作,你获刑两年,但如果你此时改为背叛,则只需1年。如果对方背叛而你守口如瓶,你将获刑4年,此时如果你改口背叛,则只需3年。因此,不管对方如何,你都最好采取背叛策略。
1702376617
1702376618 不过,在上述推理链条中存在一个漏洞。那就是你的同伙不是傻子,他跟你一样,也在进行同样的推理,也会得出同样的结论。这样导致的结果就是,你们两人都背叛,各自入狱3年。这里的困境就在于,如果你们俩都采用对自己最佳、最理性的优势策略,所获得的结果还不如你们同时保持沉默!你们都得到了第三等的结果,但如果你们都合作的话,就可以获得第二等的结果。
1702376619
1702376620 看起来是不是很无奈?这就是囚徒困境。只要你们相互信任、彼此合作,就能比自私自利获得更好的结果。借助这一思考工具,我们可以更清晰地领会合作的意义:一方付出代价让另一方获利。在囚徒困境中,如果双方都合作,就放弃了各自最优的结果——1年刑期,而获得了次优的结果。但跟双方都背叛相比,这仍然是一个不错的选择。
1702376621
1702376622 囚徒困境的形成,很大程度上取决于矩阵中合作与背叛所对应的利益安排。通过对各种选择所对应回报价值的大小进行排列,可以对囚徒困境进行明确定义:R(Reward)是双方都合作时所获得的利益,S(Sucker)是一方合作、另一方背叛时合作方的损失,T(Temptation)是对方合作时己方背叛所获得的好处,P(Punishment)是双方背叛时得到的惩罚。我们来详细讨论这些概念。双方合作的回报价值R明显要高于双方背叛的惩罚P。然而当一方合作、一方背叛时,背叛者获得最高的回报T,而不幸的合作方则要接受最差的结果——傻子回报S。总的来说,当T > R > P > S时,就形成了囚徒困境。就这个基本博弈来说,我们也可以对各种回报以其他顺序进行排列,从而得到不同的合作困境。但在所有这些困境之中,囚徒困境是最难解决的,你可以将其视为合作的终极困境。
1702376623
1702376624 在日常生活中,类似的困境总会以这样那样的形式发生在我们身上。当跟我竞争升职机会的同事休假时,我愿意帮他完成他分内的工作吗?两个互为竞争对手的公司各自定价时,是应该串通一气以获得最大的利润,还是应该竞相降价以抢夺市场?还有超级大国之间、邻国之间,甚至不同物种之间的军备竞赛,都是囚徒困境的很好的例子。如果相互竞争的国家之间能够达成合作,避免军备竞赛,这样对大家都有好处。然而,对每一个国家来说,它们各自的优势策略却都是大幅加强本方的军备。
1702376625
1702376626
1702376627
1702376628
1702376629 超级合作者 [:1702376296]
1702376630 超级合作者 我与“囚徒困境”的不解之缘
1702376631
1702376632 当我在阿尔卑斯的小屋里第一次接触到囚徒困境理论时,立刻就被它深深地吸引住了,并在之后的几十年中深陷其中,难以自拔。在那个时候,卡尔也成了我的“囚徒”,人身自由受到我的限制,因为他没有任何交通工具,必须搭我的车回维也纳。第二天,我们在回去的路上还一直在讨论囚徒困境。这一趟搭乘之后,我并没有“释放”卡尔,而是始终将他保持在我的视线以内。不久,我就开始在维也纳大学数学学院念博士了。这个学院曾经涌现过许多了不起的人物,包括著名物理学家路德维希·玻尔兹曼(Ludwig Boltzmann)、逻辑学家库尔特·哥德尔(Kurt Gödel),还有基因之父格雷戈尔·孟德尔(Gregor Mendel)。
1702376633
1702376634 攻读博士期间,我经常跟卡尔在当地的咖啡馆见面讨论,那里有着活跃的学术讨论气氛。哥德尔曾在那里发表不完备定理,玻尔兹曼曾在那里研究熵,路德维希·维特根斯坦(Ludwig Wittgenstein)也曾在那里挑战维也纳学派—— 一群经常聚集在一起讨论数学与哲学问题的知识分子。有一天,我和卡尔在中央咖啡馆喝咖啡,这个咖啡馆有着漂亮的拱形屋顶和大理石柱子,列夫·达维多维奇·托洛茨基(Trotsky)就是在那里谋划了俄国的十月革命。
1702376635
1702376636 我们一边啜饮着浓浓的咖啡,一边对囚徒困境展开讨论,并且对这个问题的微妙之处有了全新的发现。这个问题曾让许多聪明的人陷入其中,而我们当时并没想到,在之后的二十年中,我们会针对囚徒困境设计出新的数学研究方法,我们会利用计算机建立起群体模型、研究不同群体如何进化,分析并揭示囚徒困境的解决机制。更没有想到,我还将建立横跨牛津、普林斯顿和哈佛三所大学的团队,与来自世界各地的数学家、生物学家、化学家、经济学家和医生进行合作,共同研究这些机制的运行方式,分析它们所蕴含的更广泛含义。
1702376637
1702376638 有些科学家认为,囚徒困境是关于生物行为、进化和生命的深刻隐喻。而另一些人则认为,相对于真实的社会与生物世界而言,囚徒困境还过于简单,很多细微因素还未予考虑。这两种观点我都同意。囚徒困境本身并不是理解生命的钥匙,我们必须把它放在进化的大背景下来观察,才能获得关于生物世界的启示。
1702376639
1702376640 进化只能发生在由不断繁殖的个体所组成的种群中。在这些种群里,繁衍过程中的DNA复制错误将导致突变,而突变后的种群会以不同的速度进行繁衍,一些突变种群比另一些种群更能适应某一种环境。不同的繁衍速度导致了选择,快速繁殖的个体被大自然所选择,并繁荣发展。在这个背景下来考虑囚徒困境的回报和代价,可以映射为进化科学家眼中的“适应性”(也可视为繁殖速度)。那么,囚徒困境中的“合作”就可以表述为:如果我帮助你,就会降低我的适应性,并提高你的适应性。
1702376641
1702376642 现在,真正有意思的事情来了。当以进化的观点来思考囚徒困境的时候,我们有了一个重要发现:自然选择似乎并不支持囚徒困境基本模式中的合作行为,而且从本质上看,自然选择还会削弱我们的合作能力。为什么呢?因为在数学家所谓的均匀混合种群中,任意两个个体的相遇机会均等,合作者的适应性总是低于背叛者,也就是说,合作者的生存机会更小。随着合作者相继死去,背叛者的数量在自然选择的过程中会越来越多,最后,合作者完全灭绝。这太不可思议了!因为完全由合作者组成的种群,其平均适应性要比背叛者种群的适应性更高。那么自然选择实际上破坏了种群整体的利益,导致无法获得群体最优的结果。
1702376643
1702376644 如果说自然选择是有利于合作的,那么某种合作进行机制就必不可少。我们相信这种机制的确存在,因为周围有许许多多的证据表明自然选择偏爱于合作:从高大的白蚁丘,到体育场摇滚音乐会,以及蜂拥往返于市区和郊区间的上班族,都是关于合作的最好的例子。千百万年来,无论是细胞、微生物还是动物,都经历了一系列基因进化的过程。最终,大自然还是青睐合作者。
1702376645
1702376646 同时,这些合作机制也推动了文化的进化,即我们在行为、穿着、说话、艺术创作等方方面面的变化。从这一角度看,进化更容易得到理解:我们从彼此身上学习,并据此改变自己的行为方式。这种进化所需要的时间周期相对更短,例如,在人类种族内部,人们会学习与周围环境打交道的各种策略和技巧,无论是宗教、造船术还是木匠活。合作对于文化的影响是巨大的,而且在我看来,正因为有了合作,生活才如此美丽动人。
1702376647
1702376648
1702376649
[ 上一页 ]  [ :1.7023766e+09 ]  [ 下一页 ]