打字猴:1.701023573e+09
1701023573 根据常识,在连续10次得到正面朝上的结果后,下一次反面朝上的概率肯定要略高一点儿,只有这样才能修正目前的不平衡状况。
1701023574
1701023575 但是,常识也非常明确地告诉我们,硬币肯定无法记得前10次是什么样的结果!
1701023576
1701023577 我还是开诚布公地为大家答疑解惑吧:我们根据常识完成的第二次分析是正确的。“平均定律”这个说法不妥当,因为“定律”应该是正确的,而所谓的“平均定律”却是错误的。硬币没有记忆,因此,再次抛出硬币时,正面朝上的概率仍然是50%。总的比例会趋近于50%,但这并不意味着在出现若干次正面朝上的结果后,幸运女神就会青睐反面。实际的情况是,随着抛硬币的次数越来越多,前10次结果的影响力就会越来越小。如果我们再抛1 000次,那么这1 010次正面朝上的比例仍然接近50%。大数定律不会对已经发生的情况进行平衡,而是利用新的数据来削弱它的影响力,直至前面的结果从比例上看影响力非常小,可以忽略不计。这就是大数定律发生作用的原理。
1701023578
1701023579 评判暴行的数学方法
1701023580
1701023581 前文对抛硬币与考试分数的分析,同样适用于大屠杀与种族灭绝行为。如果我们根据死亡人数在全国人口中所占比例来评判这些事件,那么在分析人口总数非常小的国家所发生的暴行时往往会犯非常严重的错误。马修·怀特(Matthew White)在他的《暴行备忘录》(Great Big Book of Horrible Things)一书中,心平气和地研究了各种恐怖事件,并使用上述方法来评判20世纪发生的暴行。他认为,排在前三位的分别是德国殖民者对纳米比亚赫雷罗人的大屠杀、波尔布特对柬埔寨人的屠杀和利奥波德国王在刚果发起的殖民战争,而希特勒的暴行却榜上无名。
1701023582
1701023583 这种分析方法对人口较少的国家有失公允,因此有可能导致某些问题。我们在阅读以色列、巴勒斯坦、尼加拉瓜或者西班牙人惨遭屠杀的报道时,心情会十分沉痛。在衡量这种悲痛程度时,我们能找到经过数学方法验证的评判方法吗?
1701023584
1701023585 我可以告诉大家一个我自认为行之有效的经验法则:如果屠杀的规模非常之大,导致“幸存者”为数不多时,用比例的方式来表示死亡人数是可行的。我们在提到卢旺达种族大屠杀的幸存者时,指的很可能是生活在卢旺达的图西人,因此,我们可以说种族暴力行为屠杀了75%的图西人。我们也可以说,导致75%的瑞士人罹难的灾害,其悲惨程度等同于图西人遭遇的种族灭绝惨剧。
1701023586
1701023587 但是,如果我们把一名西雅图居民称作“9·11”恐怖袭击事件的“幸存者”,就有点儿荒谬了。因此,用其在美国人口中所占比例来评价“9·11”恐怖袭击的恶劣程度,可能并不是很妥当,在“9·11”恐怖袭击事件中死亡的人占美国人口的比例仅为0.001%。这个数字非常接近于零,凭直觉我们很难正确理解这样一个比例到底意味着什么。
1701023588
1701023589 我们既不能使用绝对数,又不可以使用比例,那么我们到底如何评判这些暴行呢?有时候,利用比较的方式会取得不错的效果。比如,卢旺达种族大屠杀比“9·11”恐怖袭击事件恶劣,“9·11”恐怖袭击事件比哥伦拜恩校园枪击事件恶劣,哥伦拜恩校园枪击事件又比造成1人死亡的醉驾事故恶劣。但是,由于时空关系,还有的事件难以比较。“三十年战争”真的比第一次世界大战更惨烈吗?卢旺达种族大屠杀的发生速度之快令人瞠目结舌,而两伊战争则旷日持久,这两者又如何比较?
1701023590
1701023591 大多数数学家认为,历史上的这些惨剧和暴行形成了所谓的“半序集”(partially ordered set)。也就是说,在这些灾难中,有的可以两两比较,其他的则无法比较。这个观点看似高明,其实不然,因为我们并没有统计出精确的死亡人数,在评判导致人员死亡的炸弹袭击与战争引发的饥荒这两类事件时,对于哪一类事件更为恶劣的问题也没有形成明确的结论;因为比较战争残忍程度的问题和比较数量大小的问题,在本质上是完全不同的。比较数量大小时,我们总是能得出答案,而比较战争的残忍程度时,有时候我们却无法判断哪一场战争更加残忍。如果我们希望了解26人在恐怖袭击中丧生的悲剧会给我们带来什么样的感受,我们可以想象这次恐怖袭击就发生在我们所在的这座城市,而不是远在地球的另一端,同时还造成26人罹难。这个方法无论在数学还是道德层面都是无可指摘的,也不需要进行复杂的计算。
1701023592
1701023593 [1]统计学专业知识丰富的读者应该可以注意到,我一直小心翼翼地避免使用“标准偏差”(standard deviation)这个术语。其他读者如果希望进一步了解它,需要查询相关资料。
1701023594
1701023595 [2]准确地讲,这个概率比95.45%略小,更接近95.37%,因为1 000的平方根不是31,而是略大于31。
1701023596
1701023597 [3]其实,生男孩的概率是51.5%,生女孩的概率是48.5%,但是,这又有什么关系呢?
1701023598
1701023599
1701023600
1701023601
1701023602 魔鬼数学:大数据时代,数学思维的力量 [:1701022619]
1701023603 魔鬼数学:大数据时代,数学思维的力量 第5章 比盘子还大的饼状图
1701023604
1701023605 即使在分析一些相对简单、看似争议不大的问题时,计算比例的方法也可能会误导我们。
1701023606
1701023607 经济学家迈克尔·斯宾塞(Michael Spence)与桑戴尔·赫施瓦约(Sandile Hlatshwayo)在一篇论文中描绘了美国就业增长态势的美好图景。一直以来,人们自信地认为美国是一个工业化大国,工厂在夜以继日地生产全世界急需的各种产品。但是,目前的现实却大不一样。1990~2008年,美国经济实际创造了2 730万个就业岗位,其中,有2 670万个(占98%)来自非贸易部门,即政府、医疗、零售与饮食服务等领域,这些领域的工作不可外包,产品也不可销往海外。
1701023608
1701023609 98%这个数字很好地反映了美国近代工业的发展史,因此,《经济学人》(Economist)杂志、比尔·克林顿(Bill Clinton)的新书等各类出版物纷纷加以引用。但是,我们必须搞清楚这个数字的确切含义。98%与100%非常接近,那么,这项研究是不是说明美国经济体中的就业增长几乎全部集中在非贸易部门呢?似乎的确如此。实际上,这个结论并不完全正确。1990~2008年,贸易部门新增的就业岗位仅为62万个,而且,就实际情况而言,这还不是最糟糕的结果,因为在这段时间内,贸易部门的就业岗位甚至一度面临不增反降的危险。2000~2008年,贸易部门的就业岗位有所减少,缩水了大约300万个,而非贸易部门则新增700万个就业岗位。在400万个新增岗位中,非贸易部门贡献了700万个,占总数的175%。
1701023610
1701023611 因此,我们必须牢记下面这条箴言:
1701023612
1701023613 在数字有可能是负值时,不要讨论它们的百分比。
1701023614
1701023615 也许有人会认为我小心过头了。负数也是数字,与其他数字一样,可以进行乘法与除法的运算。实际上,这个问题并不像我们一开始想的那样无足轻重。数学领域的前辈们甚至不清楚负数到底是不是数字,因为负数表示的数量意义与正数不完全相同。卡尔达诺、韦达(Francois Viete)等16世纪伟大的代数学家们,就负数与负数的乘积是否为正数的问题争论不休,他们都认为从一致性角度来看负数与负数的乘积必须是正数,但这到底是已经证明的事实还是仅仅针对这套符号系统的权宜之计,他们在这个问题上的观点大相径庭。卡尔达诺在解方程时,如果得到的根中有一个负数,他就习惯性地把这个讨厌的根称作“假根”(fi cta)。
1701023616
1701023617 针对这个问题,文艺复兴时期的意大利数学家们给出了各种各样的证明过程,在我们看来,有的证明与他们的宗教理论一样深奥难懂,而且相关性不强。但是,他们的有些观点却不无道理:如果把负数与百分比等代数运算相结合,就会让人类的直觉无所适从。如果你们违背我送给你们的这条箴言,各种稀奇古怪的不一致现象就会纷至沓来。
1701023618
1701023619 我举个例子来说明这个问题。假设我开了一家咖啡店,但是咖啡卖得并不好。上个月,我在咖啡销售方面亏损了500元。不过,我有先见之明,我的咖啡店还销售点心和CD(光盘),这两种业务则分别为我赚了750元。
1701023620
1701023621 总的算来,我这个月赚了1 000元,其中75%的盈利来自点心销售。因此,点心销售似乎是目前的主要赢利项目,而且几乎所有的利润都是销售羊角面包赚来的。但是,我也可以认为,利润的75%来自CD销售。假如我在咖啡销售方面的亏损增加了1 000元,我的总利润就是零,点心销售在盈利中所占的比例就是无穷大。[1]“75%”似乎意味着“几乎全部”,但是如果考虑的是可能为正值也可能为负值的数字,例如利润,那么这个百分比所代表的含义可能会发生翻天覆地的变化。
1701023622
[ 上一页 ]  [ :1.701023573e+09 ]  [ 下一页 ]