打字猴:1.70101722e+09
1701017220
1701017221 2.选择的代表数有误
1701017222
1701017223 我们曾经提到,数据的代表数有很多种:算术平均数、中位数、众数。如果不注意观察分析,那是容易上当的。
1701017224
1701017225 * 一年前,某房产商向顾客介绍说某地区每户居民的收入是15 000美元。这在1930年代是相当高的。确实,那里居住着几家大富豪。这个数字是当地居民年收入的算术平均数。一年后,房产商向地方当局申请降低税率,报告中说的是每户居民收入是3 500美元。这是因为只有一半家庭的收入高于3 500美元,其余一半则低于3 500美元。这一中位数对征税面有很大关系。可是,当一位零售商打算在该地区开超市时,房产商向他提供的数据是每户居民的年平均收入是2 000美元。因为这里的工人家庭很多,以2 000美元年收入居民最多。这一众数是统计和分析购买力的主要数据。
1701017226
1701017227 *《时代周刊》有一篇“出版者的话”。它对新订户介绍说:“本杂志订户年龄的中位数是34岁,他们的家庭年收入是7 270美元。”又一年的介绍则是:“本杂志订户年龄的中位数是42岁,他们的家庭年收入是9 535美元。”他们对年龄指出是中位数,而收入数字则不指明。是否用平均数来炫耀他们拥有富裕的读者呢?
1701017228
1701017229 3.用模糊的字眼误导
1701017230
1701017231 * 一篇实验报告,用大字在报纸上公布:“用××药××克便能在11秒内杀死试管里的31 108个细菌”。挑选一个奇特的实验室作背景,配一穿白大褂的医务人员的照片做陪衬。于是一份药品广告就完成了。但是,这种药在试管里有效,在人的喉咙里依然有效吗?药经过稀释之后,还能杀死细菌吗?对这种不负责任的宣传,不信为好。
1701017232
1701017233 * 美国《星期日》周报上刊有一份“盖塞标准”,其中提到“一个婴儿到第×个月就能坐直”。许多父母看到这则消息,马上联想到自己的孩子。如果他们的孩子到这个月份还坐不直,就会怀疑是“弱智”、“软骨”、“发育不正常”等。这个标准是什么意思呢?据了解,这是孩子出生到能坐直时间的“中位数”。一半的孩子在×月时一定是坐不直的。没有什么可担心的。“标准”一词,意味着达不到此数据就不合格,可是中位数是不能作为标准的。
1701017234
1701017235 * 1952年美国《柯里尔》杂志刊登两张图表,并说“要知道你的孩子成年时的身高,根据现在的身高查一查图表就行了”。这两张图表是千真万确的,错误的是那句说明词。经检查,两张图表制作时所使用的样本很大,抽样很科学,数据也很准确。然而,调查是根据大样本的平均身高为依据的。要知道,孩子的生长规律并不一样:有的早早长高,有的很晚才“窜”起来。所以这张表只能用于一群人(例如100个孩子)平均身高的预测,而不可以对“单个”孩子作身高预测。这次误导的结果是造成许多人的烦恼和失望。
1701017236
1701017237 * 一篇文章为“书价”太高作辩解:书价是由成本上升而造成的。十年来,原材料上涨了9%,印刷费增加了12%,推销广告费用上升了10%。这样,公司成本就增加了31%,书价如何能不涨?如果每个项目都增加10%,那么总成本也只增加10%,而不是 30%。这种数据欺诈是利用人们的数学常识不够。
1701017238
1701017239 4.忽视数据的随机误差
1701017240
1701017241 采取数据的时候,不可避免地要产生误差。这种误差是随机因素产生的,不表示实质意义。例如,在某班级的一次考试中,99分和98分根本没有实质性的能力差别。其差异是考题选择,学生临考时的身体状况,学生回答时的心理表现,乃至气候、考卷清晰度等因素。细微的差距在统计学上是没有意义的。但是,在现实生活中,可能因一分之差而落榜,两分之优受父母重奖。更有甚者,因几分之差受奚落而走上绝路的,每年都有。我们在考试管理时,“从高分到低分”的录取办法也许是不得已而为之。但是,考试部门、学校领导、父母家长,可否不要强化那些没有统计意义的差别,给孩子们比较宽松的环境呢?能否正确对待这一随机误差,当是社会数学素质强弱的标志之一。
1701017242
1701017243 统计上常常用标准差来表示。例如,考查一个学生的“智商”,得到的数据应该是98±5或者101±4。在这个范围内的差异是正常的,没有本质的差别。让我们来看一些例子。
1701017244
1701017245 * 20世纪50年代,著名的《读者文摘》杂志组织了一些人,对不同牌号的香烟中所含的尼古丁量进行随机抽查检验。得到的结果是,各种牌号香烟的尼古丁含量只有非常微小的差别,在统计上看是相同的。杂志社刊登了各牌号的尼古丁含量数据,结论是,“香烟有害,都不要抽”。
1701017246
1701017247 但是,这些牌号的尼古丁含量毕竟有微小的差异。排在最后一位的“老金牌”香烟,抓住机会大做文章:一时电报满天飞,报纸大做宣传,说“老金牌”香烟的尼古丁含量最小,大捞商机。后来,生产“老金牌”香烟的厂家被禁止用此数据做广告,但是广告效应已经存在。“不正当”竞争已成事实。
1701017248
1701017249 * 某杂志进行读者调查,发现有40%的读者喜欢A类文章,35%的读者喜欢B类文章。于是编辑们约写了大量A类文章,结果喜欢B类文章的读者纷纷退订,遭受了一次重创。其实,从杂志的问卷调查之类的结果来看,读者反应随意性很大,误差是不可忽视的。40%和35%并没有实质性的差别。
1701017250
1701017251 5.使用不同的比较基数
1701017252
1701017253 * 一则广告说:“××牌号榨汁机能多榨出26%的果汁”,“它已经由实验室所证实,且由××著名家政学院作担保”。这听起来很诱人:一只苹果可多榨出26%的果汁,当然是一件好事。不过,它没说参照物,比什么多26%呢?仔细一查,原来是比老式的手摇机多26%而已。这和你原来的想象差之千里,也许它是现代同类产品中最差的榨汁机。这26%除了显示一种精确的科学数据之外,毫无意义。
1701017254
1701017255 * 一篇文章谈到,“如果早上以每小时70英里的速度驾车,那么你活下来的机会是晚上7时驾车的4倍”。论据是晚上车祸的比例是早上的4倍。这是毫无意义的论证。晚上车多,自然出事的机会多。基数不一样,怎能比较?照这种推理,我们可以说,晴天驾车比雾天危险,因为晴天的车祸比雾天多。其实,晴天的汽车数会比雾天的汽车多许多倍。你也可以说,现在乘飞机比20世纪20年代更危险,因为现在的飞机失事多。但是,现在的飞机乘客数比20世纪20年代不知大了多少倍。
1701017256
1701017257 * 一份报告说,在美国和西班牙战争时,美国海军的死亡比例是千分之九,而纽约市民的死亡率则是千分之十六。结论是,参加海军比较安全。这是毫无意义的比较。海军中都是健康的青壮年,纽约市民则包括病人、老人……
1701017258
1701017259 总之,套用一句成语说:“成也数据,败也数据。”数据给我们带来科学、信息、愉悦;但也会被滥用,带来虚假、欺诈、烦恼。愿我们多多学习,提高数据意识,迎接未来的数据时代。
1701017260
1701017261
1701017262
1701017263
1701017264 数学文化教程 [:1701013752]
1701017265 数学文化教程 第七节 苏联李森科的“伪科学”数据[3]
1701017266
1701017267 苏联的科学界,因为政治气候不正常,曾出现过许多冤案,也培植了一些伪科学。其中,李森科自诩为“米丘林遗传学派”,把基因理论说成是“反动的”、“唯心的”,打击和迫害一些生物学家,造成了严重的后果。
1701017268
1701017269 李森科的“科学”工作,虽然一时十分“火爆”,被吹得神乎其神;但是,纸包不住火,最后终于暴露真相,身败名裂。他最恶劣的一手便是伪造数据,欺世盗名,以保持他的学阀地位。
[ 上一页 ]  [ :1.70101722e+09 ]  [ 下一页 ]