打字猴:1.701039415e+09
1701039415 统计数据会说谎:让你远离数据陷阱 [:1701039014]
1701039416
1701039417 统计数据会说谎:让你远离数据陷阱
1701039418
1701039419
1701039420
1701039421
1701039422
1701039423 统计数据会说谎:让你远离数据陷阱
1701039424
1701039425 如果你不介意,让我们假设你有两个孩子,彼得和琳达(我们还可以给他们起个更时髦的名字)。他们像许多上学的孩子一样,参加了智力测验。现在有很多人都盲目崇拜着各种各样的智力测验,所以为了找出测验结果,也许你免不了得做很多测试题。这种高深莫测的信息一般只有心理学家和教育家才能了解。反正最后你得知彼得的智商为98,琳达为101。而且你也知道,智力测验的平均水平指数为100,也就是一般所说的“正常水平”指数。
1701039426
1701039427 啊哈!琳达比较聪明,她的智商高于平均水平,彼得就不及平均水平。但是不妨让我们仔细想想这件事情。
1701039428
1701039429 所有类似的结论绝对是瞎扯!
1701039430
1701039431 为了避免产生误会,我们首先要明确的是,无论智力测验都包含什么内容,它绝对和我们平时所说的“智力”相去甚远。这种智力测验通常都忽略了诸如领导力和创造力等重要因素。它也从不考虑社会判断力、音乐、艺术及其他天赋,更不必说勤奋上进和情感平衡等重要的个人素质。不仅如此,学校里进行的测试通常都是快捷而省事的,测试结果主要取决于一个人的阅读能力,而一个阅读能力较弱的人压根儿就没有机会来证明自己聪明与否。
1701039432
1701039433 先假定我们都意识到了这一点,并且一致认同——智力测验只不过是用来测量某种模糊的解决问题的能力。假设彼得和琳达接受的测验正是人们普遍认为最好的一种——修订后的斯坦福–比奈测验,这种测验较为个体化,对阅读能力也没有什么要求。
1701039434
1701039435
1701039436
1701039437
1701039438 进行智力测验的意图在于获得智力样本。与采用其他抽样方法得出的结果一样,表明智商的数据也存在统计误差,这主要是指其精确性和可靠性。
1701039439
1701039440 智力测验的测验过程有点像估量一块地里的玉米质量:你在地里走来走去,随意剥下一些玉米穗。等到你剥了100个左右的玉米穗时,你就能大致了解这块地里的玉米质量如何。你的信息已足够准确,可以用来与其他地里的玉米比较——假设这两块地不太一样。如果两块地的情况相似,你就得多剥一些玉米穗,用精确的质量标准来给玉米穗划分等级。
1701039441
1701039442 样本代表整体数据的精确度可以用数字来表示:概率误差和标准误差。
1701039443
1701039444 假设你要通过步测来测量出好几块田地的规模。首先,你要做的应该是检查测量体系的准确性,你可以反复步测几次你认为的100码(91.44米),你会发现平均有3码(约2.74米)的误差。也就是说,一半的测量比100码多3码,另一半则少3码。
1701039445
1701039446
1701039447
1701039448
1701039449 这样你的概率误差就是每100码有3码的误差,即3%。此后你每步测100码就可以记录为100 ± 3码。
1701039450
1701039451 (相比而言,大多数统计学家倾向于使用另一种测量方法,也就是标准误差。这种方法中,2/3单位将落在加、减一个标准误差的范围内,而不是1/2单位,而且更加便于计算。就我们的目的而言,我们还是坚持使用概率误差,并将其运用到斯坦福–比奈智力测验中。)
1701039452
1701039453 假设和我们假想的步测一样,斯坦福–比奈智力测验的误差也是3%。这与测验本身的好坏没有关系,重点是测验与它所要测试的内容是否一致。因此,彼得的智商应该完整地表示为“98±3”,琳达的智商则是“101±3”。
1701039454
1701039455 也就是说,彼得的智商可能是95~101之间的某个数字,当然也有可能会大于101或小于95。同样,琳达的智商有50%的可能在98~104之间。由此,你很快就能明白:彼得的智商高于101的可能性为25%,同样,琳达的智商低于98的可能性也是25%。从这个角度来说,彼得的智商就不是低于而是高于琳达,他们之间的差距为3。
1701039456
1701039457 因此得出结论:对待智商和其他抽样结果应注意看它的范围。“正常”并不绝对是100,而应是类似90~110的区间,将一个范围内的孩子与其他更低或更高范围内的孩子的智商相比才有意义。但是将差别不大的数据予以比较是没有意义的。你必须时刻谨记“±”这个符号,即使它没有被明确标出。
1701039458
1701039459 忽视抽样调查中隐藏的误差会导致一些非常愚蠢的行为。有些杂志编辑将读者调查奉为绝对真理,主要是因为他们并不了解调查。比如,有40%的男性读者表示他们喜欢一篇文章,35%的男性读者喜欢另外一篇,编辑们就会更多地采用类似于第一篇的文章。
1701039460
1701039461 35%和40%的读者群的差别对一本杂志来说非常重要,但是调查所得的差别却未必真实。出于成本的考虑,读者群的样本往往会刨掉一些人,尤其是从来不看杂志的人,最后剩下的不过几百人。妇女类杂志的读者样本中男性读者很少。在做调查时,问题的答案选项通常分为“全部都读”“读大多数”“读一部分”和“都没有读”,35%的结论可能来自很少的调查人群。隐藏在这个令人惊叹的数据之后的概率误差也许很大,以此作为凭据的编辑们不过是抓住了一根细细的救命稻草而已。
1701039462
1701039463 有时人们会为了计算一个可以论证,却细微得毫无意义的差别而大费周章。这种行为无疑是对这条古训的蔑视:只有显现出来的差别有意义时才可称之为差别。“流金岁月”(Old Gold)牌香烟利用毫无意义的争论大赚一笔的案例就是一个绝佳的例子。
1701039464
[ 上一页 ]  [ :1.701039415e+09 ]  [ 下一页 ]