打字猴:1.701023586e+09
1701023586
1701023587 但是,如果我们把一名西雅图居民称作“9·11”恐怖袭击事件的“幸存者”,就有点儿荒谬了。因此,用其在美国人口中所占比例来评价“9·11”恐怖袭击的恶劣程度,可能并不是很妥当,在“9·11”恐怖袭击事件中死亡的人占美国人口的比例仅为0.001%。这个数字非常接近于零,凭直觉我们很难正确理解这样一个比例到底意味着什么。
1701023588
1701023589 我们既不能使用绝对数,又不可以使用比例,那么我们到底如何评判这些暴行呢?有时候,利用比较的方式会取得不错的效果。比如,卢旺达种族大屠杀比“9·11”恐怖袭击事件恶劣,“9·11”恐怖袭击事件比哥伦拜恩校园枪击事件恶劣,哥伦拜恩校园枪击事件又比造成1人死亡的醉驾事故恶劣。但是,由于时空关系,还有的事件难以比较。“三十年战争”真的比第一次世界大战更惨烈吗?卢旺达种族大屠杀的发生速度之快令人瞠目结舌,而两伊战争则旷日持久,这两者又如何比较?
1701023590
1701023591 大多数数学家认为,历史上的这些惨剧和暴行形成了所谓的“半序集”(partially ordered set)。也就是说,在这些灾难中,有的可以两两比较,其他的则无法比较。这个观点看似高明,其实不然,因为我们并没有统计出精确的死亡人数,在评判导致人员死亡的炸弹袭击与战争引发的饥荒这两类事件时,对于哪一类事件更为恶劣的问题也没有形成明确的结论;因为比较战争残忍程度的问题和比较数量大小的问题,在本质上是完全不同的。比较数量大小时,我们总是能得出答案,而比较战争的残忍程度时,有时候我们却无法判断哪一场战争更加残忍。如果我们希望了解26人在恐怖袭击中丧生的悲剧会给我们带来什么样的感受,我们可以想象这次恐怖袭击就发生在我们所在的这座城市,而不是远在地球的另一端,同时还造成26人罹难。这个方法无论在数学还是道德层面都是无可指摘的,也不需要进行复杂的计算。
1701023592
1701023593 [1]统计学专业知识丰富的读者应该可以注意到,我一直小心翼翼地避免使用“标准偏差”(standard deviation)这个术语。其他读者如果希望进一步了解它,需要查询相关资料。
1701023594
1701023595 [2]准确地讲,这个概率比95.45%略小,更接近95.37%,因为1 000的平方根不是31,而是略大于31。
1701023596
1701023597 [3]其实,生男孩的概率是51.5%,生女孩的概率是48.5%,但是,这又有什么关系呢?
1701023598
1701023599
1701023600
1701023601
1701023602 魔鬼数学:大数据时代,数学思维的力量 [:1701022619]
1701023603 魔鬼数学:大数据时代,数学思维的力量 第5章 比盘子还大的饼状图
1701023604
1701023605 即使在分析一些相对简单、看似争议不大的问题时,计算比例的方法也可能会误导我们。
1701023606
1701023607 经济学家迈克尔·斯宾塞(Michael Spence)与桑戴尔·赫施瓦约(Sandile Hlatshwayo)在一篇论文中描绘了美国就业增长态势的美好图景。一直以来,人们自信地认为美国是一个工业化大国,工厂在夜以继日地生产全世界急需的各种产品。但是,目前的现实却大不一样。1990~2008年,美国经济实际创造了2 730万个就业岗位,其中,有2 670万个(占98%)来自非贸易部门,即政府、医疗、零售与饮食服务等领域,这些领域的工作不可外包,产品也不可销往海外。
1701023608
1701023609 98%这个数字很好地反映了美国近代工业的发展史,因此,《经济学人》(Economist)杂志、比尔·克林顿(Bill Clinton)的新书等各类出版物纷纷加以引用。但是,我们必须搞清楚这个数字的确切含义。98%与100%非常接近,那么,这项研究是不是说明美国经济体中的就业增长几乎全部集中在非贸易部门呢?似乎的确如此。实际上,这个结论并不完全正确。1990~2008年,贸易部门新增的就业岗位仅为62万个,而且,就实际情况而言,这还不是最糟糕的结果,因为在这段时间内,贸易部门的就业岗位甚至一度面临不增反降的危险。2000~2008年,贸易部门的就业岗位有所减少,缩水了大约300万个,而非贸易部门则新增700万个就业岗位。在400万个新增岗位中,非贸易部门贡献了700万个,占总数的175%。
1701023610
1701023611 因此,我们必须牢记下面这条箴言:
1701023612
1701023613 在数字有可能是负值时,不要讨论它们的百分比。
1701023614
1701023615 也许有人会认为我小心过头了。负数也是数字,与其他数字一样,可以进行乘法与除法的运算。实际上,这个问题并不像我们一开始想的那样无足轻重。数学领域的前辈们甚至不清楚负数到底是不是数字,因为负数表示的数量意义与正数不完全相同。卡尔达诺、韦达(Francois Viete)等16世纪伟大的代数学家们,就负数与负数的乘积是否为正数的问题争论不休,他们都认为从一致性角度来看负数与负数的乘积必须是正数,但这到底是已经证明的事实还是仅仅针对这套符号系统的权宜之计,他们在这个问题上的观点大相径庭。卡尔达诺在解方程时,如果得到的根中有一个负数,他就习惯性地把这个讨厌的根称作“假根”(fi cta)。
1701023616
1701023617 针对这个问题,文艺复兴时期的意大利数学家们给出了各种各样的证明过程,在我们看来,有的证明与他们的宗教理论一样深奥难懂,而且相关性不强。但是,他们的有些观点却不无道理:如果把负数与百分比等代数运算相结合,就会让人类的直觉无所适从。如果你们违背我送给你们的这条箴言,各种稀奇古怪的不一致现象就会纷至沓来。
1701023618
1701023619 我举个例子来说明这个问题。假设我开了一家咖啡店,但是咖啡卖得并不好。上个月,我在咖啡销售方面亏损了500元。不过,我有先见之明,我的咖啡店还销售点心和CD(光盘),这两种业务则分别为我赚了750元。
1701023620
1701023621 总的算来,我这个月赚了1 000元,其中75%的盈利来自点心销售。因此,点心销售似乎是目前的主要赢利项目,而且几乎所有的利润都是销售羊角面包赚来的。但是,我也可以认为,利润的75%来自CD销售。假如我在咖啡销售方面的亏损增加了1 000元,我的总利润就是零,点心销售在盈利中所占的比例就是无穷大。[1]“75%”似乎意味着“几乎全部”,但是如果考虑的是可能为正值也可能为负值的数字,例如利润,那么这个百分比所代表的含义可能会发生翻天覆地的变化。
1701023622
1701023623 我们在学习只能取正值的数字(例如开支、收入或人口)时,不会出现上述问题。如果75%的美国人都认为保罗·麦卡特尼(Paul McCartney)是甲壳虫乐队中最可爱的成员,就不可能会有75%的美国人会选择林戈·斯塔尔(Ringo Starr)。林戈、乔治(George)[2]与约翰(John)只能分享剩余的25%的支持率。
1701023624
1701023625 我们从就业数据中也能发现此类现象。如果斯宾塞与赫施瓦约说:金融与保险业创造了60万个就业机会,在整个贸易部门创造的所有就业机会中所占的比例约为100%,可不可以呢?可以,但是他们并没有这样说,这是因为他们不希望大家错误地以为,在那段时间里,美国经济的其他领域没有取得增长。大家可能仍然记得,自1990年至今,美国经济中至少还有一个领域增加了大量就业机会——那个被命名为“计算机系统设计与相关服务”的领域,凭一己之力,新增了100多万个就业岗位,就业人数是最初的三倍之多。金融与计算机领域新增的就业机会,远多于整个贸易部门创造的62万个新岗位,但是超出的部分与制造业显著减少的岗位数相互抵消了。在将正数与负数放到一起处理时,稍不留意,就会形成错误的认识,以为贸易部门的新增岗位全都是金融业做出的贡献。
1701023626
1701023627 对于斯宾塞与赫施瓦约在论文中提出的观点,我们并没有充分的理由表示反对。的确,数百个行业的总就业增长率有可能是负数,但是在一个相当长的时期里,在经济环境正常的情况下,则极有可能是一个正数。毕竟,人口一直在增长,只要不发生大灾难,就业机会就会随之增加。
1701023628
1701023629 然而,有些人在分析中使用百分比时却不那么小心。2011年6月,威斯康星州的共和党人发布了一则新闻,大肆吹捧州长斯科特·沃克尔(Scott Walker)创造了就业增长的新纪录。当时,美国经济从整体看延续了上个月的糟糕局面,全国仅增加了1.8万个就业岗位,而威斯康星州的就业增长却表现出好得多的势头,净增9 500个就业机会。这则新闻宣称:“我们发现,全美6月的就业增长,有超过50%要归功于我们威斯康星州。”共和党的政客们对这个观点津津乐道并四处宣传,议员吉姆·森森布莱纳(Jim Sensenbrenner)就曾在密尔沃基的一个郊区说:“上周发布的人力资源报告指出,全美新增1.8万个就业机会,其中的一半来自威斯康星州。这说明我们在这里的努力已经取得了效果。”
1701023630
1701023631 这个例子充分说明,如果以百分比的方式报道净增就业机会等既可能是正值也可能是负值的数字,就会陷入尴尬的境地。威斯康星州增加了9 500个就业机会,这当然是好事,但是,与此同时,邻近的明尼苏达州在民主党人、州长马克·代顿(Mark Dayton)的领导下,创造了超过1.3万个新增岗位,得克萨斯州、加利福尼亚州、密歇根州和马萨诸塞州的增长幅度也超过威斯康星州。的确,威斯康星州这个月取得了不错的就业成绩,但是它所做出的贡献,并不像共和党在新闻中暗示的那样,等于其余各州新增就业机会的总和。原来,其中的奥秘在于,其他各州减少的就业机会几乎正好抵消了威斯康星州、马萨诸塞州、得克萨斯州等地的新增就业岗位。也正因为如此,威斯康星州州长才有可能宣称该州为全美的就业增长做出了一半的贡献。如果明尼苏达州州长愿意,他也可以宣布全美新增就业机会中的70%要归功于他们州。两位州长的说法从技术上讲正确无误,但是从根本上讲却极易误导人。
1701023632
1701023633 接下来,我再以史蒂文·拉特勒(Steven Rattner)在《纽约时报》(New York Times)上发表的专栏文章为例。该文引用了经济学家托马斯·皮凯蒂(Thomas Piketty)和伊曼纽尔·赛斯(Emmanuel Saez)的研究成果,认为美国人从当前的经济复苏中获取的好处并不均衡。
1701023634
1701023635 新的统计数据表明,富人与其他人在财富上的差距越发地令人吃惊,我们急需解决这个问题。即使在一个对于收入不均衡已经习以为常的国家,这样的发现也让人震惊。
[ 上一页 ]  [ :1.701023586e+09 ]  [ 下一页 ]