打字猴:1.70104002e+09
1701040020
1701040021 许多数据由于无法进行对比而变得没有意义。《观察》(Look)杂志上的一篇文章在讲到唐氏综合征时曾说:“在2 800个案例中,一大半病患者母亲的年龄都达到或超过了35岁。”事实上,如果你想获知更有意义的信息,你还需要了解一下这些母亲普遍的生育年龄。但很少有人知道这些。
1701040022
1701040023 这里有一段摘自1953年1月31日《纽约客》杂志“伦敦来信”栏目的文字。
1701040024
1701040025 卫生部近日发布的一份数据表明,在大雾天气的一周内,大伦敦地区的死亡人数猛增至2 800人。这对公众而言无疑很震撼,因为他们向来将英国的不宜气候看作是讨厌鬼而非夺命杀手……这个冬天致命性大雾天气的造访……
1701040026
1701040027 但是,这个造访怎么会是致命的呢?这一周内死亡率比平时高这么多难道不是例外吗?所有的事情都处在变化之中。那么,随后几周情况如何?死亡率降至平均水平以下,是否意味着大雾中死去的人本来就已不久于人世?这个数据的确让人印象深刻,但由于没有其他数据可以对比,所以这个数据也变得没什么意义。
1701040028
1701040029 有时,材料只给出了百分数,却没有给出原始数据,这种数据也带有欺骗性。很久之前,约翰·霍普金斯大学开始招收女性学生,有个特别反对男女同校的人报道了一则让人大吃一惊的消息:约翰·霍普金斯大学33%(也就是1/3)的女生嫁给了该校的男老师!最后还是原始数据还原了事实的真相——其实当年只有3名女生入学,其中之一嫁给了大学老师。
1701040030
1701040031 若干年前,波士顿商会推选出了一些做出杰出贡献的女性,其中有16人随后被载入了《美国名人录》。据说这16个人总共有“60个学位,育有18个孩子”。似乎这个信息颇为全面,不过后来你会发现,这16人中还有弗吉尼娅·吉尔德斯利夫(Virginia Gildersleeve)院长和莉莲·吉尔布雷思(Lillian M. Gilbreth)夫人。这两人的学位加起来就占了60个学位的1/3,而仅是吉尔布雷思夫人一人就育有12个孩子。
1701040032
1701040033 一家公司宣布3 003人持有该公司的股份,每人平均持有约660股。这倒是实话。不过同样是实话的还有,公司共有200万股股票,其中,3位大股东的股份就占了3/4,而剩下的3 000人总共持有的股份只占1/4。
1701040034
1701040035
1701040036
1701040037
1701040038 如果给你一个指数,你也许要问是不是漏掉了什么。该指数也许是被挑来用以扭曲事实的。一个全国性的工人组织曾经表示:经济萧条过后,利润和生产指数的增长要比工资指数的增长快得多。但是,有人找到漏掉的数据时,这个作为要求涨工资的论据就失去了效力。这是因为经济萧条时期利润已经降至一个较低水平,其基数较小,所以利润在此基数上增长的百分比一定会比工资的大。
1701040039
1701040040 有时候被漏掉的还有导致变化发生的因素。这种遗漏往往暗示着其他因素才是导致变化发生的主要原因。有人发布了一份数据,对比了今年四月和去年四月的零售销售额,目的是要证明今年经济处于复苏阶段。但遗漏的事实是,去年复活节假期在三月,而今年的则是在四月。
1701040041
1701040042
1701040043
1701040044
1701040045 一份报告曾指出“过去25年内因癌症死亡的人数大幅增长”。这份报告也带有误导性,除非你知道这个结论是一些不相干因素的产物。例如:以前“原因不明”的病症现在都被确诊为癌症;尸体解剖更加频繁,因此诊断更为确切;医学统计材料的上报和编纂更为完善;此外,现在人均寿命延长,因此,更多人能活到容易患癌症的年龄。而且,你看到的应该是死亡总人数而非死亡率——不要忽略这个事实,因为现在的人口总数比以前要多。
1701040046
1701040047 有人偷换了概念吗?
1701040048
1701040049 在分析一份统计数据时,你要注意在原始数据和最终结论之间有没有什么地方被偷换了概念。将一件事说成是另一件事可是常有的。
1701040050
1701040051 正如上文我指出的那样,某种病例被上报的多并不意味着患这种病的人就多。某个候选人在一场非官方的民意测验中获胜并不意味着他在选举中也会获胜。虽然读者说自己喜欢看与世界时政相关的文章,但并不意味着刊登此类文章会提高杂志的销量。
1701040052
1701040053 1952年,加利福尼亚州中部山谷地带上报的脑炎病患数是此前历史最高水平的3倍。许多受到惊吓的居民都将自己的孩子送往外地。但是计算起来,因昏睡性脑炎而死亡的人数并没有增加很多。其实,事情是这样的:当时,为了解决这个地区长期以来棘手的医疗问题,大量的联邦及州立医务人员之前就来到这里,在他们的不懈努力之下,许多之前被忽略或未被识别的轻微病例也被记录在案。
1701040054
1701040055 这件事让我想起了两位纽约记者——林肯·斯蒂芬斯(Lincoln Steffens)和雅格布·里斯(Jacob A. Riis)制造的犯罪激增事件。报纸上的犯罪案件不论是在数量上还是在版面上都占了相当大的比例,甚至报社还配备了大字标题。这些使得公众要求政府采取行动来打击犯罪。时任改革警政委员会主席的西奥多·罗斯福(Theodore Roosevelt)为此大为窘迫。最后,他不得不开除这两位记者才制止了这场犯罪激增事件。引起这一切的原因,不过是因为这两人带领记者们搞了个竞赛,看谁报道的盗窃等类似案件最多。但是,官方记录在案的犯罪事件却没有增多。
1701040056
1701040057 “5岁以上的英国男性在冬天洗热水澡的平均次数为每周1.7次,夏天为每周2.1次,”某报纸曾这样报道,“而英国女性在冬天洗热水澡的平均次数为每周1.5次,夏天为每周2.0次。”数据的来源是英国建筑工程部(The Ministry of Works)的一项热水调查,调查对象是“6 000个典型的英国家庭”。可以说,这个样本具备代表性,而且样本的规模也足够庞大。这个调查足以证实旧金山《编年史》(Chronicle)的有趣结论:英国的男性比女性更爱洗澡。
1701040058
1701040059
1701040060
1701040061
1701040062 如果能说明调查所用的平均数到底是均值还是中位数,那么,这些数据就更能说明问题。然而,调查存在的主要问题还是偷换概念。该调查所得到的答案只是人们声称的洗澡次数,而非他们真实的洗澡次数。当涉及的主题是如此私密的问题,而且还关系到英国人洗澡的传统时,说的和做的可就未必是一回事儿了。说不清到底英国男性和女性谁更常洗澡,一个比较保险的结论是“他们自己说他们是这么做的”。
1701040063
1701040064 这还有更多偷换概念的方式需要你留心。
1701040065
1701040066 当某次普查发现,1935年的农场数量比5年前要多50万个左右时,人们都以为这是一场“回归农场”的运动。但是,实际情况是两次统计数量的口径不一样。美国人口普查局所定义的农场概念发生了变化,所以,按照1935年的定义,1930年并不算在内的30万个农场都被囊括进来了。
1701040067
1701040068 当数据是在人们口头回答的基础上得出时(即使人们所说的似乎都是客观事实),怪事就出现了。比如,人口普查报告表明年龄为35岁的人要多于年龄为34岁或36岁的人。这种数据来自一个现象:家庭成员在上报其他人的年龄时,不会说确切的年龄,而是倾向于报出一个整数,一般这个整数都是5的倍数。要想知道每人的准确年龄,你就得询问他们的生日。
1701040069
[ 上一页 ]  [ :1.70104002e+09 ]  [ 下一页 ]