打字猴:1.70101257e+09
1701012570
1701012571 然而,在刚开始的时候,统计学这门学科的确给人一种恐怖的感觉。第一位统计人员的统计对象是死亡人数,这位统计人员名叫约翰·格朗特,是一名纽扣制造商。尽管他从事的工作与数学无关,但是他对周围世界的运行规律颇感兴趣。格朗特想办法收集“死亡公报”以了解伦敦1604—1661年死亡人口的详细资料,还收集了出生人口数据,然后将这些数据汇集成册。他的目的是通过研究这些数字,了解伦敦底层人民的生活概况。
1701012572
1701012573 在一定程度上看,他的工作就是收集散落于各种文件中的相关数据,然后将这些已有数据公布出来,这是人类有史以来第一次了解到不同年份瘟疫致死人数的情况。然而,仅仅整理这些已有的数据,并不能让格朗特感到满足。他还将数字加以整合,从而发现前人没有发现的信息。例如,他根据整合后的数据估算出伦敦的人口数量(当时还没有人口普查),并试图了解不同人群的预期寿命差异。
1701012574
1701012575 正是这项预期寿命研究,再加上天文学家埃德蒙·哈雷后来所做的分析,直接催生了一个新的行业——保险业,这个行业主要针对的是人们在综合考虑统计数据与未来可能情况之后的不确定心理。当时,人们喜欢聚集在伦敦的咖啡屋里谈生意。这种把赌注押在未来结果上的行业就始于这些熙熙攘攘的人群,随后,借助当时最全面的统计数据,迅速向世界各地蔓延,成了每个人都要打交道的一个行业。
1701012576
1701012577 尽管遭到了迪斯累里的鄙视,但是统计学作为一门独立的学科,发展的态势似乎一帆风顺。当统计学与概率(研究可能性的数学分支)相遇之后,更是迸发出耀眼的火花。在此之前,数学在它与现实世界之间的关系中一直处于从属地位,它诚实地展示当前的状况或者解释已经发生的事。但是,统计学这个全新的数学分支却在社会底层人民的支持下,大言不惭地预测起未来,而且它的预测结果与牛顿的“机械宇宙观”不同,充满了不确定性和风险。于是,数学描述周围世界的能力取得了重大突破,并把触角伸至尚未发生的未来。最终,概率和统计学的重要性与日俱增,被用来描述包括气体特性、神秘量子在内的所有事物。我们将在第13章深入讨论这方面的内容。
1701012578
1701012579 要想在蓬勃发展的保险业叱咤风云,仅掌握足够多的数据是不够的,还必须把这些数据变成“水晶球”(格朗特已经证明,这是有可能的),才能用它们预测未来。所谓水晶球,是指那些社会底层人民的生活习惯,而不只是那些纽扣制造商的各种癖好。这是一个赌徒的世界。仔细想想,保险业就像一个赌场:它披着行业的外衣,希望可以通过赌局保持不断前进的态势,“玩家”虽然有赚钱的可能性,但在大多数情况下,他们投入的钱都变成了保险公司的利润。
1701012580
1701012581 赌博业的历史源远流长,人们曾经在有几千年历史的考古地点发掘出几个表面光滑的指关节,这是一种早期的四面体色子。自从有了硬币之后,抛硬币的游戏就开始兴起,而且似乎经久不衰。这个游戏非常简单,可以直接利用硬币的正反两面得到随机数据。至少在硬币没被动过手脚的情况下,它产生的都是随机数据。自古以来,人类就嗜赌,无论是对赛跑还是天气打赌,都能让人们享受到赌博的乐趣。总体而言,无论是赌徒还是诚实的庄家,他们依赖的基本都是直觉和猜测。然而,在意大利数学家(也是一名狂热的赌徒)吉罗拉莫·卡尔达诺出现之后,这种状况就发生了彻底的变化。
1701012582
1701012583 前文在讨论虚数时提到过卡尔达诺,他把变幻莫测的可能性引入数学世界,这不仅对数学的未来发展具有重要意义,而且在将数学与难以捉摸的寻常事物分离开的过程中,也发挥着举足轻重的作用。卡尔达诺出生于1500年前后,20多岁时开始撰写一本关于概率的书,但是直到他60多岁时才写完。最终,这本书于17世纪60年代出版。一般而言,这么长的时间跨度足以让它淡出人们的视线,但是它的出版仍然引起了人们的广泛关注,这说明卡尔达诺的思想非常超前。这本书就是《机遇博弈》(Liber de Ludo Aleae)。
1701012584
1701012585 几乎所有经常玩抛硬币游戏的人都知道,如果硬币没有问题,抛出正面和反面的概率是相等的。没有人知道下一次抛掷会出现什么结果,但是出现正面或者反面的可能性是均等的。卡尔达诺的贡献在于,通过简单直接的观察,将观察结果变成一个数字结构——把分数的概念与对未来的预测结合起来,使我们对一个简单的系统(例如抛硬币)有了深刻的理解。
1701012586
1701012587 当然,硬币没被动过手脚这个限制条件非常重要。要让人们尊重概率,难点之一就在于赌徒(尤其是职业赌徒)经常作弊。有的职业赌徒通过使用两面都是正面图案的硬币,在抛硬币游戏中无往不利,有的则在三牌赌皇后游戏中熟练使用简单而有高度欺骗性的“从最上面拿牌”的手法[1]。但是,他们都有一个共同点:他们仿佛具有某种魔力,可以轻易地误导那些容易上当的对象,说服他们参加赌博游戏。我们至少可以认为职业赌徒、魔术师和小偷之间的界限比较模糊。
1701012588
1701012589 我在做关于概率和统计学的报告时,通常会一开始先举抛硬币的例子。我会拿出一枚硬币,并告诉观众,我在报告开始之前已经花了一些时间抛这枚硬币,并且最后9次的结果都是正面。(这个结果完全是有可能的,但是通常需要花一点儿时间。)然后,我问观众,如果我再抛一次硬币,会出现什么样的结果?一种观点认为,既然正面和反面各有一半的概率,在出现这么多的正面之后,下一次出现反面的可能性应该更大。还有一种观点认为,因为这枚硬币明显偏向正面朝上,因此下一次出现正面的可能性更大。到底哪一种观点是正确的呢?总有一些人会说,“出现反面的可能性更大”,这就是所谓的“赌徒谬误”,因为在现实世界中,硬币没有记忆能力,之前的结果不会对之后的结果产生任何影响。然而,在连续出现同一个结果之后,人们很容易就会以为接下来出现另外一种结果的可能性更大。
1701012590
1701012591 通常情况下,大多数观众都会给出正确答案:出现正面和反面的概率各一半。但是,有一些人仍然认为出现正面的概率更大。这可能是经常出现在体育比赛中的另外一个谬误——热手谬误。所谓热手谬误是指,体育迷认为一连串好的结果意味着某位选手或某支球队将保持“连胜势头”。但如果我又连续抛出三个正面,观众就开始产生怀疑。他们的怀疑是正确的:我使用的硬币两面都是正面。(此时,观众会提出相同的问题:“你从哪里搞到这枚硬币的?”答案是电子港湾网站。)有趣的是,观众不可避免地对这枚硬币产生了强烈的兴趣,就好像电影中的高明骗局使我们欲罢不能一样。他们希望看一看这枚有两个正面的硬币,还想亲手摸一摸这个邪恶的道具。
1701012592
1701012593 在卡尔达诺那个年代,人们都知道,只要硬币质地均匀,出现正面或反面的可能性是一样的。(严格地说,真实情况并非如此。根据抛掷的方式,标准硬币出现正面和反面的概率大约是51∶49或49∶51,第一次抛掷时朝上的一面略占优势。)但是,没有人把这种机会均等的情况变成一种适合数学研究的形式。尽管表达抛硬币时正面朝上的可能性的方法有很多,诸如机会均等,各占一半,但是只有用可以进行算术运算的数字来表示,它才最有利于数学研究。第一个提出用从0(表示“不会发生”)到1(表示“肯定会发生”)的数字表示概率的人正是卡尔达诺。根据这种方法,硬币正面朝上的可能性可以表示为1/2。
1701012594
1701012595 这种表现形式直截了当,但是除了为预测行为奠定数学基础之外,卡尔达诺还有其他的贡献。[卡尔达诺应该没有使用“概率”(probability)这个词。从14世纪开始,法语中就出现了这个词,意思是“不确定,但是有可能”。至于具有现代数学意义的“概率”概念,最早的使用记录只能追溯至1692年。]套用他处理抛硬币时使用的那个方法,我们可以说,从我们现在使用的一副普通扑克牌(不包括大小王)中抽出某一张牌的可能性是1/52。
1701012596
1701012597 卡尔达诺还提出了计算组合概率的两个重要方法。后来的事实证明,这两个方法对于所有赌博游戏玩家来说都具有非常重要的意义(别忘了,卡尔达诺不仅是一名数学家,还是一名狂热的赌徒)。第一个方法可以帮助我们计算得到多个可能结果的组合概率。比如,根据卡尔达诺最初的理解,我们知道掷一次色子得到任何特定点数(例如6)的概率是1/6。但是,如果你想知道得到1点或者6点的可能性,答案就应该是2/6,也就是1/3。
1701012598
1701012599 卡尔达诺还证明,计算两枚色子掷出相同点数(例如在双色子游戏中掷出两个6点或者两个1点)的组合概率的方法是将两个分数相乘,也就是1/6×1/6,即1/36。因此,得到某个相同点数的可能性只有1/36。此外,他还发现,这与用两枚色子掷出一个1点和一个6点略有不同。要得到后面的结果,一共有两种方法:第一枚色子得到1点,第二枚色子得到6点,或者第一枚色子得到6点,第二枚色子得到1点。因此,概率是1/36 + 1/36 = 2/36,即1/18。
1701012600
1701012601 卡尔达诺最巧妙的一个发现是计算双色子游戏中任意一枚色子得到6点的概率。也就是说,我掷两枚色子,至少有一枚掷出6点。至于是一个6点还是两个6点,以及哪枚色子得到6点,我都不在乎。我们经常会遇到这种组合概率,而人们的自然反应是使用加法。每枚色子得到6点的概率都是1/6,因此第一反应是把它们加到一起。但这种做法显然是错误的,否则,只需6枚色子就能确保得到一个6点。而玩过色子游戏的人都知道,真实情况并不是这样。
1701012602
1701012603 现在的问题是要想办法表示“任意一枚”的可能结果。卡尔达诺的高明之处在于他发现,这个问题可以先转化为“两枚色子都没有”的问题,再用他发明的方法,即用乘法算出概率。如果一枚色子得到6点的概率是1/6,那么结果不是6点的概率就是5/6。因此,两枚色子都没有掷出6点的概率是5/6×5/6,即25/36。也就是说,两枚色子中有任意一枚掷出6点的可能性是1 – 25/36,即11/36。与用一枚色子掷出6点的概率相比,前者比后者的两倍(12/36)还小。随着色子的数量增加,这个概率将会趋近1(也就是肯定有色子掷出6点),但永远不会等于1。因此,即使同时掷出很多枚色子,也有可能没有一个6点。
1701012604
1701012605 在卡尔达诺之后,人们对他的研究成果进行了完善和发展,其中最著名的是法国数学家布莱瑟·帕斯卡和皮埃尔·德·费马,两人合作解决了一个众所周知的难题,从而让概率变成一个深受保险业欢迎的工具。他们解决的那个难题叫作“点数分配问题”。两名势均力敌的玩家因为一笔奖金而“激战”,根据规则,点数首先达到某个数字的玩家获胜。但是,如果他们在游戏结束时还没有决出胜负,该怎么分配那笔奖金呢?
1701012606
1701012607 假设每赢一局就得一点,在游戏结束时,一位玩家有12点,另一位玩家有7点。帕斯卡认为,要想合理地分配这笔钱,就需要考虑若游戏可以一直持续下去直至两人决出胜负,每名玩家需要赢多少局才能获胜。假设设定的目标是15点。在这种情况下,第一位玩家只需再赢3局就可以获胜,而第二位玩家还需要再赢8局。帕斯卡根据双方获胜还需要赢得的点数,考察了接下来可能发生的情况,然后用数学语言给出了一个公平分配奖金的方案。他提出的其实是一个叫作“期望值”的概念。所谓期望值,是指根据预期,某个可以产生随机结果的过程在连续重复多次后可能得到的结果。
1701012608
1701012609 下面我举一个非常简单的例子。假设游戏规则要求你连续掷色子10次,然后根据掷出的平均点数获得相应的现金。赌注设为多少时,这个游戏才值得参与呢?常识告诉我们,我们赢到的钱可能是概率的中值。难得的是,这次我们的常识是正确的(在涉及概率时,常识往往并不可靠)。你也许会不假思索地回答3,因为3是6的一半。但是,如果我们把1—6这6个值排成一排,就会发现中间值应该是3和4的平均值,也就是说期望值是3.5。
1701012610
1701012611 我们也可以通过一种更严谨的方式来考虑这个问题。掷出1点的可能性是1/6,掷出2点的可能性是1/6,以此类推,掷出6点的可能性也是1/6。求1×1/6 + 2×1/6 + 3×1/6 + … + 6×1/6的和,得数为21/6,即3.5。既然你有可能赢得的预期奖金是3.5美元,那么赌注低于这个金额都是可以接受的。在任意一局中,你都有可能输钱,但是只要玩的局数足够多(并准备足够多的本金),最终的赢家应该还是你。
1701012612
1701012613 计算交易期望值的概念绝不仅限于赌博,它是各种现代金融系统的基础,其中最典型的例子就是保险公司。它们就像赌博玩家。保险公司通过设定赔率,保证即使自己在某一“局”(他们称之为“保险单”)赔钱,也总体来说一定会赚钱。当然,赌场也是这样。重要的是,这个计算方法可以用于权衡不同的选择方案,并帮助我们做出最有利的决定。
1701012614
1701012615 比如,假设你有两个可能的投资方案。一个投资方案有1/2的可能性赢利1 000美元,有1/2的可能性不赢利;另一个投资方案有1/4的可能性赢利1 900美元,有3/4的可能性不赢利。哪个投资方案更有利呢?我们可以用概率乘以投资结果的方式计算出期望值。如果选择第一个投资方案,期望值就是500美元,而第二个方案的期望值是475美元。因此,第一个投资方案对你更有利,尽管第二个方案有可能赢利更多。如果某个投资方案会产生不止一个可能的结果,就要把发生这些结果的可能性加到一起。
1701012616
1701012617 同其他基于概率的预测方法一样,期望值也没有魔力,无法完成不可能的任务。期望值不会告诉你掷一次色子能赢得什么,但是只要你掷色子的次数足够多,就可以根据期望值预测可能的结果,至少在公平游戏中可以做到这一点。伯努利家族的一位才华横溢的成员指出,在某些情况下,期望值也不可靠。
1701012618
1701012619 在介绍伯努利的发现之前,我们先设想一种十分荒谬的彩票,以此说明期望值这种简单的计算方式有时未必有效。(我之前举的例子都是碰运气的游戏,在这些游戏中我们可以计算出精确的概率。同样的方法也可以应用在商业投资、购买保险等方面,但是此时,我们只能根据具体情况对概率做出估计。)
[ 上一页 ]  [ :1.70101257e+09 ]  [ 下一页 ]