1701039665
1701039666
同样有趣的还与百分比有关。在某个时期,通用汽车公司(General Motors)上报了一个相对低调的税后销售利润率:12.6%。但是,同期通用汽车公司的投资收益率为44.8%。这到底是好是坏,还要取决于你将这个数据运用在什么情况下。
1701039667
1701039668
同样,《哈珀斯》的一位读者曾在“读者来信”专栏中为A&P(店名)商店辩护,说是该商店的净盈利很少,只占销售所得的1.1%。他质问道:“如果某个美国公民一年内每投资1 000美元所得利润仅为10美元零几美分,他会担心自己因成为奸商而受到公众的谴责吗?”
1701039669
1701039670
乍一听,你会觉得1.1%的利润率真是少得可怜。与我们所熟悉的联邦政府管理局的抵押贷款和银行贷款等4%~6%或更高的利率相比,这真的很低。A&P商店还不如退出零售业,将资金投到银行,靠利息过活都比卖东西强。
1701039671
1701039672
但问题在于,投资所得的年收益与总销售所得的利润完全是两码事儿。正如另一位读者后来在《哈珀斯》上的回信所说:“如果我每天早上花99美分购入一件物品,到下午再将它以1美元的价格售出,那么我在总销售上只挣了1%的利润,但是这一年里我的投资收益率却是365%。”
1701039673
1701039674
通常描述数据有很多种方法。比如,你在描述完全相同的事情时,可以将其说成1%的销售利润率,或是15%的投资收益率,或是1 000万美元的利润,或是利润增长了40%(与1935—1939年的平均水平相比),或者是相比去年下跌了60%。最终选择哪一种方法,要根据自己当前的目的来决定,选择最贴切的那个说法。相信我,没人能看出这些数据根本就无法说明实际情况。
1701039675
1701039676
并非所有“看似相关的数据”都是蓄意欺瞒的产物。不少统计数据对大家来说都非常重要,如医学数据。但由于从一开始报告就有出入,导致这些数据被歪曲了。在流产、非婚生育、梅毒等微妙的问题上,数据往往惊人地矛盾。如果你查阅某个时间段流感和肺炎的相关数据,你会得出一个奇怪的结论:这些疾病几乎只发生在南方的三个州,其传染者占所上报病患总数的约80%。其实,这个百分比说明了一个问题:当时,这三个州所上报的疾病在其他州已经停止上报了。
1701039677
1701039678
一些与疟疾相关的数据也说明不了什么问题。1940年之前,美国南部每年成千上万的人罹患疟疾,但在1950年前后,这些地方患病的人只是极少数。这个有益于公众健康的重要变化在仅仅几年之内就完成了。但实际情况是,1950年前后只有被证实是疟疾的病例才会被记录下来,而以前,“疟疾”这个词在南方的俗语中一般用来指代感冒或着凉。
1701039679
1701039680
1898年“美西战争”期间,美国海军的死亡率是9‰,而同期纽约市市民的死亡率为16‰。后来,海军征兵部门的人就拿这个数据来说明待在部队更安全。假设这些数据都是精确的,因为它们可能很准确。但稍等一下,看看你能否发现其中的伎俩,或者说征兵人员根据它们得出的结论是否毫无意义。
1701039681
1701039682
1701039683
1701039684
1701039685
这两组数据根本没什么可比性。海军的主要构成人员是年轻人,大家都知道他们是年富力强的代表。而市民中包含了婴儿、老年人、病人等,这些人不管放在哪里都是高死亡率的人群。所以这些数据并不能证明符合海军征兵标准的人就一定比部队之外的人更长寿。反之,他们也无法证明相反的观点。
1701039686
1701039687
也许你曾听说这样一则令人沮丧的消息:1952年是医学史上患小儿麻痹症人数最多的一年。这个结论是基于所有人都会询问的证据得出的:这一年所上报的病例比之前的任何一年都多。
1701039688
1701039689
但当专家们回过头再次研究这些数据时,他们发现了一些鼓舞人心的东西:首先,因为1952年有更多孩子处于体质最敏感的时期,如果发病率保持一定水平,那么更多病例就会被记录在案;其次,当时社会上已经对小儿麻痹症有了一定的认识,因此能诊断出更多病患,甚至一些轻微病例也被登记;最后,由于当年的财政刺激增加,小儿麻痹症保险和来自美国国家小儿麻痹症基金会的援助也有所增加。以上原因统统使得人们怀疑小儿麻痹症患病人数的增长,后来的死亡人数使人们更加肯定了这种怀疑。
1701039690
1701039691
有趣的是,在测量一种疾病的发病情况时,死亡率或死亡人数往往比发病率的数据更为客观。这是因为在上报或记录死亡情况时,死亡人数的数据质量更高,情况更真实。显然,在这种情况下,看似相关或半相关的数据要比表面上看起来完全相关的数据更好。
1701039692
1701039693
在美国,这种看似相关的数据每4年就会出现一次兴盛。这并不能说明这种数据是周期性出现的,造成这种现象的原因是美国每4年就有一次总统大选。1948年10月共和党发表的一篇竞选陈述就是基于一些貌似相关,实则不然的数据:
1701039694
1701039695
1942年杜威(Dewey)当选为纽约州州长时,一些地区的教师最低工资为每年900美元。而如今,该州的教师享有全世界最高的工资。1947年,根据委员会的表决,杜威州长安排立法机关从州财政盈余中划拨了3 200万美元直接用于提高教师的工资待遇。因此,纽约州的教师最低工资水平提高至每年2 500美元至5 325美元不等。
1701039696
1701039697
这件事足以证明杜威先生真是老师的好朋友,但这些数据未必能证明这一点。这里使用的是那一套前后对照的老把戏:使用了一个未被说明的数据,然后让这个数据看起来与原来的不一样。这里,你可以看到“之前”的教师年薪为900美元,“之后”的为2 500~5 325美元,这听起来的确像是大幅增长。但是,前者是纽约州农村地区教师的最低工资,而后者则是纽约市的最低工资。所以说在杜威州长的领导下,教师们的工资也许提高了,也许没提高。
1701039698
1701039699
我们经常可以在杂志和广告上见到陈述中滥用的前后对照图表的统计形式。有两张照片照的是同一间客厅,这是为了证明刷上一层油漆后的显著不同。但是在两次照相期间,广告商会加入新的家具,更何况“之前”的照片只是一张光线很差的黑白小照,而“之后”的照片则是一张色泽鲜明的彩色大照。还有个例子:有两张照片能向你展示一个姑娘使用护发素前后的明显不同。天啊!她使用了护发素后,看起来是多么漂亮啊!但你若仔细检验,会发现她之所以变美多半是由于她的嫣然一笑以及打在她头发上的背光。因此,这应归功于摄影师而非护发素。
1701039700
1701039701
1701039702
1701039703
1701039705
1701039706
统计数据会说谎:让你远离数据陷阱
1701039707
1701039708
1701039709
1701039710
1701039711
1701039712
统计数据会说谎:让你远离数据陷阱
1701039713
1701039714
曾经有人想方设法地要研究,与不抽烟的人相比,抽烟者是否成绩更差。事实证明的确如此——抽烟者成绩更糟。这个结论让许多人非常高兴,自此以后,他们就经常拿这个结果说事儿。貌似想要成绩好就得戒烟,进一步还能得出一个合理的结论:抽烟会让人变笨!
[
上一页 ]
[ :1.701039665e+09 ]
[
下一页 ]