打字猴:1.70101722e+09

1701017220

1701017221 2.选择的代表数有误

1701017222

1701017223 我们曾经提到，数据的代表数有很多种：算术平均数、中位数、众数。如果不注意观察分析，那是容易上当的。

1701017224

1701017225 ＊一年前，某房产商向顾客介绍说某地区每户居民的收入是15 000美元。这在1930年代是相当高的。确实，那里居住着几家大富豪。这个数字是当地居民年收入的算术平均数。一年后，房产商向地方当局申请降低税率，报告中说的是每户居民收入是3 500美元。这是因为只有一半家庭的收入高于3 500美元，其余一半则低于3 500美元。这一中位数对征税面有很大关系。可是，当一位零售商打算在该地区开超市时，房产商向他提供的数据是每户居民的年平均收入是2 000美元。因为这里的工人家庭很多，以2 000美元年收入居民最多。这一众数是统计和分析购买力的主要数据。

1701017226

1701017227 ＊《时代周刊》有一篇“出版者的话”。它对新订户介绍说：“本杂志订户年龄的中位数是34岁，他们的家庭年收入是7 270美元。”又一年的介绍则是：“本杂志订户年龄的中位数是42岁，他们的家庭年收入是9 535美元。”他们对年龄指出是中位数，而收入数字则不指明。是否用平均数来炫耀他们拥有富裕的读者呢？

1701017228

1701017229 3.用模糊的字眼误导

1701017230

1701017231 ＊一篇实验报告，用大字在报纸上公布：“用××药××克便能在11秒内杀死试管里的31 108个细菌”。挑选一个奇特的实验室作背景，配一穿白大褂的医务人员的照片做陪衬。于是一份药品广告就完成了。但是，这种药在试管里有效，在人的喉咙里依然有效吗？药经过稀释之后，还能杀死细菌吗？对这种不负责任的宣传，不信为好。

1701017232

1701017233 ＊美国《星期日》周报上刊有一份“盖塞标准”，其中提到“一个婴儿到第×个月就能坐直”。许多父母看到这则消息，马上联想到自己的孩子。如果他们的孩子到这个月份还坐不直，就会怀疑是“弱智”、“软骨”、“发育不正常”等。这个标准是什么意思呢？据了解，这是孩子出生到能坐直时间的“中位数”。一半的孩子在×月时一定是坐不直的。没有什么可担心的。“标准”一词，意味着达不到此数据就不合格，可是中位数是不能作为标准的。

1701017234

1701017235 ＊ 1952年美国《柯里尔》杂志刊登两张图表，并说“要知道你的孩子成年时的身高，根据现在的身高查一查图表就行了”。这两张图表是千真万确的，错误的是那句说明词。经检查，两张图表制作时所使用的样本很大，抽样很科学，数据也很准确。然而，调查是根据大样本的平均身高为依据的。要知道，孩子的生长规律并不一样：有的早早长高，有的很晚才“窜”起来。所以这张表只能用于一群人（例如100个孩子）平均身高的预测，而不可以对“单个”孩子作身高预测。这次误导的结果是造成许多人的烦恼和失望。

1701017236

1701017237 ＊一篇文章为“书价”太高作辩解：书价是由成本上升而造成的。十年来，原材料上涨了9%，印刷费增加了12%，推销广告费用上升了10%。这样，公司成本就增加了31%，书价如何能不涨？如果每个项目都增加10%，那么总成本也只增加10%，而不是 30%。这种数据欺诈是利用人们的数学常识不够。

1701017238

1701017239 4.忽视数据的随机误差

1701017240

1701017241 采取数据的时候，不可避免地要产生误差。这种误差是随机因素产生的，不表示实质意义。例如，在某班级的一次考试中，99分和98分根本没有实质性的能力差别。其差异是考题选择，学生临考时的身体状况，学生回答时的心理表现，乃至气候、考卷清晰度等因素。细微的差距在统计学上是没有意义的。但是，在现实生活中，可能因一分之差而落榜，两分之优受父母重奖。更有甚者，因几分之差受奚落而走上绝路的，每年都有。我们在考试管理时，“从高分到低分”的录取办法也许是不得已而为之。但是，考试部门、学校领导、父母家长，可否不要强化那些没有统计意义的差别，给孩子们比较宽松的环境呢？能否正确对待这一随机误差，当是社会数学素质强弱的标志之一。

1701017242

1701017243 统计上常常用标准差来表示。例如，考查一个学生的“智商”，得到的数据应该是98±5或者101±4。在这个范围内的差异是正常的，没有本质的差别。让我们来看一些例子。

1701017244

1701017245 ＊ 20世纪50年代，著名的《读者文摘》杂志组织了一些人，对不同牌号的香烟中所含的尼古丁量进行随机抽查检验。得到的结果是，各种牌号香烟的尼古丁含量只有非常微小的差别，在统计上看是相同的。杂志社刊登了各牌号的尼古丁含量数据，结论是，“香烟有害，都不要抽”。

1701017246

1701017247 但是，这些牌号的尼古丁含量毕竟有微小的差异。排在最后一位的“老金牌”香烟，抓住机会大做文章：一时电报满天飞，报纸大做宣传，说“老金牌”香烟的尼古丁含量最小，大捞商机。后来，生产“老金牌”香烟的厂家被禁止用此数据做广告，但是广告效应已经存在。“不正当”竞争已成事实。

1701017248

1701017249 ＊某杂志进行读者调查，发现有40%的读者喜欢A类文章，35%的读者喜欢B类文章。于是编辑们约写了大量A类文章，结果喜欢B类文章的读者纷纷退订，遭受了一次重创。其实，从杂志的问卷调查之类的结果来看，读者反应随意性很大，误差是不可忽视的。40%和35%并没有实质性的差别。

1701017250

1701017251 5.使用不同的比较基数

1701017252

1701017253 ＊一则广告说：“××牌号榨汁机能多榨出26%的果汁”，“它已经由实验室所证实，且由××著名家政学院作担保”。这听起来很诱人：一只苹果可多榨出26%的果汁，当然是一件好事。不过，它没说参照物，比什么多26%呢？仔细一查，原来是比老式的手摇机多26%而已。这和你原来的想象差之千里，也许它是现代同类产品中最差的榨汁机。这26%除了显示一种精确的科学数据之外，毫无意义。

1701017254

1701017255 ＊一篇文章谈到，“如果早上以每小时70英里的速度驾车，那么你活下来的机会是晚上7时驾车的4倍”。论据是晚上车祸的比例是早上的4倍。这是毫无意义的论证。晚上车多，自然出事的机会多。基数不一样，怎能比较？照这种推理，我们可以说，晴天驾车比雾天危险，因为晴天的车祸比雾天多。其实，晴天的汽车数会比雾天的汽车多许多倍。你也可以说，现在乘飞机比20世纪20年代更危险，因为现在的飞机失事多。但是，现在的飞机乘客数比20世纪20年代不知大了多少倍。

1701017256

1701017257 ＊一份报告说，在美国和西班牙战争时，美国海军的死亡比例是千分之九，而纽约市民的死亡率则是千分之十六。结论是，参加海军比较安全。这是毫无意义的比较。海军中都是健康的青壮年，纽约市民则包括病人、老人……

1701017258

1701017259 总之，套用一句成语说：“成也数据，败也数据。”数据给我们带来科学、信息、愉悦；但也会被滥用，带来虚假、欺诈、烦恼。愿我们多多学习，提高数据意识，迎接未来的数据时代。

1701017260

1701017261

1701017262

1701017263

1701017264 数学文化教程 [:1701013752]

1701017265 数学文化教程第七节苏联李森科的“伪科学”数据[3]

1701017266

1701017267 苏联的科学界，因为政治气候不正常，曾出现过许多冤案，也培植了一些伪科学。其中，李森科自诩为“米丘林遗传学派”，把基因理论说成是“反动的”、“唯心的”，打击和迫害一些生物学家，造成了严重的后果。

1701017268

1701017269 李森科的“科学”工作，虽然一时十分“火爆”，被吹得神乎其神；但是，纸包不住火，最后终于暴露真相，身败名裂。他最恶劣的一手便是伪造数据，欺世盗名，以保持他的学阀地位。

[ 上一页 ] [ :1.70101722e+09 ] [ 下一页 ]