1702629793
1702629794
数字不会说谎,但说谎的人会算计。
1702629795
1702629796
查尔斯·格罗夫纳
1702629797
1702629798
数据是数字,而数字总显得非常可信。其实有的数字是这样,有的却并非如此。任何统计研究中最重要的事,就是数据的来源。专栏作者安·兰德斯问她的读者,如果可以重新来过,是否还会生孩子?回答的人中有70%坚定地说“不要”。但是,你对于兰德斯从泪迹斑斑的信中,引述读者哭诉他们的孩子如何像野兽一样的话语,大可一笑置之。因为兰德斯从事的是娱乐业,她邀请读者回答这个问题时,回应最热烈的应该是那些后悔生孩子的父母。大部分的父母并不后悔生小孩。我们知道这个事实,是因为曾经有人对许多父母做过调查,而且为了规避偏见,受访的父母是随机抽取的。民意调查当然也不是没有瑕疵——这点我们后面会谈到——但它仍比邀请有一肚子不满的人来回答问题要好得多。
1702629799
1702629800
即使是信誉卓著的期刊,也不一定能对坏数据免疫。《美国医学会杂志》刊登过一篇文章,声称用管子将冷却的液体输送进胃里,可以缓解溃疡症状。这种治疗对病人的确有效果,但那只是因为病人通常会信服医生的权威性。也就是说,安慰剂(placebo,虚拟治疗)发生了作用。后来终于有人产生了质疑,做了有控制组的比较研究——有些病人接受了这项治疗,有些只使用了安慰剂——结果表明安慰剂组(控制组)的“表现”更好。“没有比较,就没有结论”,这是判断医学研究好坏的一个很好的依据。比如,我对于最近突然流行的“自然疗法”就心存怀疑。在这些疗法当中,极少会通过比较实验来证明它们不只是装在贴着漂亮植物图片的瓶子里售卖的安慰剂。
1702629801
1702629802
小心潜在变量
1702629803
1702629804
我的钱足够我这辈子花了,只要我不买东西。
1702629805
1702629806
杰基·梅森
1702629807
1702629808
有报道说,在美国,设有赌场的县犯罪率较高。有位大学教师说,在线上课的学生比在教室里上课的学生表现好。政府报告强调,受过良好教育的民众比受教育少的民众赚钱多。最好不要太快下结论,而要先问一句:“有没有什么是他们没告诉我的,却可以用来解释这些事?”
1702629809
1702629810
有赌场的县的确犯罪率较高,但是在城市或是较穷的县,犯罪率也比较高。什么样的县会开设赌场呢?这些县是否在开设赌场之前,犯罪率就已经很高了呢?在线上课的学生学得比较好,但是和在教室里上课的学生比起来,前者的年龄比较大,底子也比较好,因此他们表现好很正常。受教育程度高的人的确赚钱多,但受教育多的人和受教育少的人相比,平均来说前者的父母受的教育也较多,也比较有钱。而且,前者在更好的环境中长大,上更好的学校。这些有利条件让他们接受到更多的教育,即使他们不接受这么多教育,这些有利条件也可能会帮他们赚到很多钱。
1702629811
1702629812
以上这些案例,都涉及两个变量之间的相关性,并且引导我们得出结论,即其中一个变量影响了另一个变量。“赌场会增加犯罪率”和“想变富有就要多读点儿书”,是它们传达的信息。这些信息有可能是正确的,但我们看到的相关性,大部分说不定还可以由隐藏在背景中的一些变量来解释,比如开设赌场的县的本质,以及受教育程度高的人生来就具备的有利条件。好的统计研究会考虑许多的背景变量,这当然需要技巧,不过你至少可以找一找,看它们有没有这样做。
1702629813
1702629814
变异性无所不在
1702629815
1702629816
当事实改变时,我就改变主意。您呢?
1702629817
1702629818
约翰·梅纳德·凯恩斯
1702629819
1702629820
如果你的舌下温度超过37摄氏度,是不是就代表你在发烧呢?也许不是,每个人的“正常”体温都存在差异。你自己的体温在一天当中也会有变化,早上6点时稍高,下午6点时稍低。美国政府宣布上个月的失业率上升0.1个百分点,而新屋开工率下降3个百分点,导致股市波动。股市波动常常是不理性的。政府的数据是根据那些给出乐观预测的样本得出的,是好的估计,但不是百分之百的事实。同样的调查再做一遍,结果会有一些差别。和经济有关的因素原本就会上下波动,影响它的因素包括气候、罢工事件、节假日以及各式各样的其他原因。
1702629821
1702629822
很多人会像股市一样,对数据的一些微小变化做出过度反应,而事实上这些并不是实质性变化,根本微不足道。以下是全美最大的市场研究公司的领导人阿瑟·尼尔森的经验之谈:
1702629823
1702629824
太多商界人士对白纸黑字印出来的数字都深信不疑。他们认为数字就代表“事实”,让他们用“概率”的视角来看事情有点儿困难。他们不了解,数字只是一种简化的表示方法,它描述了一个范围,这个范围表明我们在现有情况下对某个问题的实际了解有多少。
1702629825
1702629826
变异性无所不在。个体之间有差别,对同一个个体多测量几次,结果也会不一样,并且几乎每件事都会随着时间的变化而变化。至于一些所谓的专家对每天股市变化背后的深入原因分析,或者对一场其实是最后一秒才定输赢的球赛,却硬要归咎于输球球队的能力或战术,你尽可以对这些嗤之以鼻。
1702629827
1702629828
统计结论不是百分之百确定的
1702629829
1702629830
数学定律不能百分之百地应用于现实生活,能百分之百地用数学定律来描述的就不是现实生活。
1702629831
1702629832
阿尔伯特·爱因斯坦
1702629833
1702629834
因为变化无所不在,所以统计结论并不是绝对的。大部分中年妇女会定期做乳腺X线检查,以便能及早发现乳腺癌。但是,乳腺X线检查真的可以降低女性死于乳腺癌的风险吗?高质量的统计研究发现,对于50~64岁的妇女来说,乳腺X线检查可以减少26%的死亡率。但这个数字是该年龄阶段妇女的一个平均数字。因为总是存在着个体差异,所以对于不同的妇女来说,结果可能大不相同。有些每年做乳腺X线检查的妇女最后却死于乳腺癌,也有一辈子没做过这种检查的妇女却活到了100岁,最终死于车祸。
1702629835
1702629836
该报告事实上说的是,“乳腺X线检查可以将乳腺癌死亡率减少26%(置信度为95%,置信区间为17%~34%)”。而根据尼尔森的观点,26%这个数字是“某个范围的简化说法,这个范围描述了我们对现时情况的实际了解程度”。在这个案例当中,这个范围是17%~34%,而且我们对它有95%的把握。也就是说,我们相当有把握,但不是百分之百确定。当你阅读新闻报道时,可以找找看有没有诸如“95%的置信度”或“有统计学显著性”等字眼,如果有,就代表这个研究结果虽不能说百分之百确定,但有很大的把握。
1702629837
1702629838
数据可反映社会价值
1702629839
1702629840
要用统计数据骗人很容易。但如果不用统计数据,骗人就更容易了。
1702629841
1702629842
弗里德里克·莫斯特勒
[
上一页 ]
[ :1.702629793e+09 ]
[
下一页 ]