1701012630
1701012631
说到这里,我们回过头去介绍伯努利家族的那名成员,看看他对期望值概念的缺陷有哪些认识。这名成员就是数学家尼古拉斯·伯努利,他是约翰·伯努利的儿子,丹尼尔·伯努利的弟弟。(在这个成就显赫的瑞士家族中,丹尼尔的名气最大。)尼古拉斯研究过一个简单游戏的结果,在这个游戏中,我们需要做的就是记录抛硬币得到的一系列结果。玩家能赢多少钱,取决于他抛硬币的结果。只要抛出反面,奖金就会加倍,游戏继续进行。一旦得到正面,游戏立刻结束,玩家的收获只是当时的奖金。
1701012632
1701012633
假设我们开始时的奖金是1美元。如果第一轮抛硬币的结果是正面,你就会赢得1美元;如果是反面,奖金就会加倍,而且你可以再抛一次。如果第二轮的结果是正面,你就会赢得2美元。如果你坚持到第三轮且得到的结果是正面,你就会赢得4美元。如果你第三轮得到反面,并且第四轮的结果是正面,你就可以赢得8美元,以此类推。尼古拉斯指出,最有意思的是,把奖金定为多少,你才愿意参加游戏?我们应该采取的做法是计算期望值,如果奖金低于期望值,就值得参与。
1701012634
1701012635
要计算出期望值,我们需要知道每次抛硬币时第一次出现正面的概率,然后用它去乘以此时的盈利,再把所有可能的结果加到一起。第一轮抛硬币时,得到正面的概率是1/2。在这种情况下,奖金是1美元,它贡献的期望值是1/2×1美元= 0.5美元。第一轮得到反面且第二轮得到正面的概率是1/2×1/2 = 1/4,此时的奖金是2美元。因此,它贡献的期望值是1/4×2美元= 0.5美元。第三轮得到正面的概率是1/8,奖金为4美元,期望值是1/8×4美元= 0.5美元。我们已经可以看出其中隐藏的规律了:每一轮的期望值都是0.5美元。
1701012636
1701012637
因此,只要把所有可能盈利的期望值加在一起,就可以计算出总期望值。也就是说,总期望值为:
1701012638
1701012639
(1/2×1美元)+(1/4×2美元)+(1/8×4美元)+(1/16×8美元)+…
1701012640
1701012641
=0.5美元 + 0.5美元 + 0.5美元 + 0.5美元 + …
1701012642
1701012643
别忘了,“…”表示继续下去。因此,上面的计算结果表明,无论参加这个游戏需要投入多少钱,根据期望值,你都应该参加。例如,即使参加这个游戏需要投入100万美元,你也应该参加,因为0.5美元 + 0.5美元 + 0.5美元 + 0.5美元 + …的值大于100万美元,实际上,这个和比任何数都大。这个级数的极限是无穷大,也就是说,这个游戏的期望值是无穷大。但是,尼古拉斯·伯努利强调的问题是,只在同样的过程重复很多次时,期望值才真的有效。对于具体某一轮的情况,期望值的效果就不那么好了。
1701012644
1701012645
很难想象有人愿意拿出100万美元,去玩一个只有50%的概率赢得1美元的游戏。其实,玩家只要想一想他们输钱的可能性,就会知道该怎么做。例如,我们知道,最多赢1美元的概率是50%(即1/2),最多赢2美元的概率是75%,最多赢4美元的概率是87.5%,最多赢8美元的概率是93.75%,最多赢16美元的概率是96.875%。也就是说,即使拿出16美元参加这个游戏,亏本的风险也很大。
1701012646
1701012647
因为觉得好玩,我刚刚又玩了一次抛硬币的游戏。想知道结果吗?我在第三轮抛出了正面,这意味着我可以赢得4美元。所有利用概率工具的人都要注意使用它的场合。计算两枚色子中至少有一枚色子掷出某个点数的概率并没有多大的难度,但是我们经常需要这种能力(例如在玩双陆棋时)。当我们在权衡是否要做出某种经济上的承诺时,我们也经常需要计算期望值。但是,考虑是否在某个游戏或投资活动中使用概率工具,不能仅依据“大量人口的平均结果”或“大量交易的平均情况”,还要考虑它可能造成的后果。
1701012648
1701012649
例如,某个银行系统通常运行顺畅,但是若每完成10 000次交易就把账户数据全部清除,我们对此肯定无法接受。如果你的账户正好是那个不幸被清空的账户,即便这套系统完美地完成了99.99%的交易,也无法平息你的怒火。因此,即使99%的案例都得到了妥善处理,性能统计的结果仍然取决于那些处理不当的案例会造成什么样的后果。如果是快餐店没有按时送来汉堡这种无关痛痒的事,这样的统计结果不会导致大问题。但如果是医院出具的常规体检报告中的死亡可能性,就肯定会让人十分担忧。
1701012650
1701012651
实践证明,在涉及大量数据或者大量调查对象时,基于概率的统计可以发挥极其重要的作用。无论这些调查对象代表的是“美国人民”还是“汽缸中的气体分子”,只要可以忽略统计方法对个体造成的影响,我们就可以借助数学工具对这些调查对象代表的群体行为做出准确程度较高的预测。
1701012652
1701012653
苏格兰物理学家詹姆斯·克拉克·麦克斯韦是在科学研究中最早大量使用数学工具的物理学家之一(我们将在下一章深入讨论),也是最早运用统计方法研究气体属性的物理学家之一。他选择了一些有强烈气味的物体作为研究对象。这些物体的气味(难闻或者好闻并不重要)传播到人的鼻子里,为什么需要那么长的时间呢?在19世纪,人们普遍认为气体分子的传播速度非常快,每秒可以运动几百米(或几百码)的距离,但是气味通常需要几秒钟的时间才能充斥整个房间。
1701012654
1701012655
德国物理学家鲁道夫·克劳修斯认为,这是因为分子发生碰撞的缘故。虽然分子的运动速度的确非常快,但是它们彼此之间不停地碰撞,以致改变了运动方向。所以,一堆新的分子(“气味分子”)需要很长时间才能完全扩散到空气中。
1701012656
1701012657
克劳修斯认为所有气体分子的运动速度都一样。但是,麦克斯韦认为这个说法没有道理,他更倾向于气体分子的运动速度各异,有的较快,有的较慢,速度分布曲线的峰值在某个区间范围内。麦克斯韦认为,如果确实如此,那么只有借助统计法,才能全面了解气体分子的特性。这就是所谓的“麦克斯韦分布”。尽管气体分子的运动速度随温度的变化而变化,但是麦克斯韦分布却找到了一个可行的计算方法。从此以后,人们掌握了预测气体变化特点的能力。
1701012658
1701012659
这种通过统计掌握多个变化个体的普遍情况的能力,不仅可以用来研究分子的特点,还可以用来研究人的行为。掌握了这种技能之后,我们才有可能了解大型人群内部正在发生的变化,并完成各种各样的预测,例如服装销量、药品需求等。但我们必须清楚,它也有局限性。即使是分子的统计特性,也有可能造成误导性的结果。我们以热力学第二定律为例。该定律称,热由高温物体向低温物体传递,封闭系统中的无序状态会保持不变或者增加。人们往往认为这是一条颠扑不破的真理,但事实上,它也是建立在统计学的基础之上的。
1701012660
1701012661
比如,根据这条定律,如果我们将两个盒子之间的隔板去掉,经过一段时间之后,两个盒子中温度不同的气体将混合到一起,变成均匀气体,其温度介于之前的两个温度之间。这是根据热力学第二定律得到的结果(两组有序程度较高的分子通过温度的选择,变成了无序的混合体)。但是,从理论上看,这些气体有可能是在重新建立短暂的完全随机的温度阶梯。一个盒子中的高温分子有可能碰巧比另一个盒子多,由于分子的数量非常多,这种偶然性不大可能产生非常大的影响,但是这种情况的确有可能发生。统计数据表现的是总体可能性,而不是必然性。
1701012662
1701012663
在使用统计方法研究人的活动时,我们有可能把典型规律套用到独特群体(例如上文所说的那些高温气体分子)上,还有可能认为关于一群人的统计规律适用于某一个体。我们无须考虑气体中单个分子的特性,因为所有分子基本上都是相同的,但人与气体分子不同。统计学历史上有一个非常有名的案例。1999年,一个英国母亲萨莉·克拉克被判定杀死了她的两个幼子,并因此在监狱中服刑近4年时间,直到这项判决被推翻之后才重获自由。克拉克含冤入狱的原因是,法庭在运用统计学工具时犯了严重的错误,不但相关人员的计算能力不过关,他们还将统计得出的整体普遍情况与个体的特定情况混为一谈。
1701012664
1701012665
这次审判是在克拉克的第二个幼子死亡之后进行的。造成克拉克的两个儿子在不足3个月时就夭折的罪魁祸首是婴儿猝死综合征(SIDS)。著名儿科专家、教授罗伊·梅多爵士应检方邀请,作为专家证人参与了此案的审判。不幸的是,梅多在概率与统计学方面的知识并不全面。研究表明,在没有其他影响因素的情况下,一个家庭中发生婴儿猝死的概率是1/8 543。梅多告诉陪审团,克拉克的两个儿子都死于婴儿猝死综合征的概率是这个数的平方,约为1/73 000 000。梅多声称,这种情况堪称百年不遇。
1701012666
1701012667
这个证据在克拉克案的判决中发挥了重要作用,但是其中存在着巨大的错误。卡尔达诺早就发现,两个无关事件的组合概率的正确计算方法是乘法。因此,我们知道,用一枚色子掷出6点的概率是1/6,连续掷出两个6点的概率是1/6×1/6 = 1/36。两次投掷是彼此不相关的两个事件,即第一次投掷不会对第二次投掷的结果产生任何影响。
1701012668
1701012669
但是,这次审判却忽略了一个问题:这个数学工具并不适用于婴儿猝死的情况。有充分的证据表明,这两起婴儿死亡事件并非彼此无关。如果一个家庭中发生过婴儿猝死,那么这类事件再次发生的可能性要远远高于普通家庭发生婴儿猝死的可能性。真相澄清后不久,有人公开发表研究结果,称一个英国家庭发生两个婴儿猝死事件的可能性并不是百年不遇,而是每18个月就有可能发生一次。
1701012670
1701012671
除了概率计算的错误,这起案件还存在其他问题,他们误认为“某件事偶然发生的概率很低”的意思等同于“发生某件事的原因并非偶然”。这是一个巨大的逻辑错误,没有任何道理可言。以“欧洲百万”乐透游戏为例,虽然中大奖的概率仅为1/116 531 799(这个可能性低到令人发指的地步),但是在大多数情况下,每周都会有幸运儿产生。由于参与的人非常多,所以不可能发生的事件也会时不时发生。我们并不能因为某件事发生的可能性非常低,就认为它不会发生。
1701012672
1701012673
即便涉及的人群不大,低概率事件也可能会发生。除忽视了这个简单的事实以外,他们还犯了一个严重的错误。婴儿猝死的概率是1/73 000 000(这个概率其实并不准确),但是他们居然因此认为,如果73 000 000个婴儿中的其他72 999 999个婴儿死亡,就一定是死于谋杀。检方应该认真权衡的两个概率是婴儿猝死的概率与一个英国家庭中母亲连续杀死两个孩子的概率,后者肯定不是72 999 999/73 000 000。统计学可以在科研(和法律事务)中发挥巨大作用,但前提条件是要正确使用。
1701012674
1701012675
显然,适用于热力学第二定律的统计学工具不能用来研究人的行为,尽管这个想法颇具诱惑力。人们倾向于“集体审议”或者聚众闹事这类行为,尽管其中有心理学原因,但这也说明一群人聚在一起,其行为的复杂程度不是一堆气体分子可以比拟的。在美国科幻小说家艾萨克·阿西莫夫以心理历史学的概念为基础创作而成的“基地”系列小说中,人们可以用一种异常强大的统计学工具研究某个文明,预测它未来的发展情况,甚至可以具体到某个事件。但是,现实中却永远不可能找到这样的统计工具。
1701012676
1701012677
阿西莫夫的创作灵感来自爱德华·吉本的经典历史学著作《罗马帝国衰亡史》。这部著作似乎告诉读者,人们可以从具体事物中找到线索,从而预见一个帝国走向衰亡的结局。阿西莫夫把这个(本来就不可靠的)概念拓展成一个研究行为特性的纯粹的数学工具。但是,为人们在现实中利用统计数据来预测复杂事物(例如文明)的未来情况时,就会像那些试图进行长期天气预报的人一样,面临同样的困难:系统过于复杂,涉及的变量过多,以致难以做出有意义的预测。在数学上,这被视为一种高度混乱的情况。这意味着开始时发生的小变化(在研究对象是一群人时,这些小变化通常是由个人的行为引起的)会对结果造成巨大的影响。
1701012678
1701012679
概率和统计学已经成为许多科学家手中威力巨大的武器。但是,事实证明,如果这些科学家的数学造诣不深,滥用统计工具就会造成一系列问题。毫无疑问,数学很有用,在科学研究中可以发挥重要作用。但是,如果过于重视统计学的“证据”作用,不仅对科学研究没有任何益处,还会导致我们在得到看似正确的数据之后做出错误的判断,还自以为揭开了天地万物的奥秘。
[
上一页 ]
[ :1.70101263e+09 ]
[
下一页 ]