打字猴:1.7026298e+09
1702629800 即使是信誉卓著的期刊,也不一定能对坏数据免疫。《美国医学会杂志》刊登过一篇文章,声称用管子将冷却的液体输送进胃里,可以缓解溃疡症状。这种治疗对病人的确有效果,但那只是因为病人通常会信服医生的权威性。也就是说,安慰剂(placebo,虚拟治疗)发生了作用。后来终于有人产生了质疑,做了有控制组的比较研究——有些病人接受了这项治疗,有些只使用了安慰剂——结果表明安慰剂组(控制组)的“表现”更好。“没有比较,就没有结论”,这是判断医学研究好坏的一个很好的依据。比如,我对于最近突然流行的“自然疗法”就心存怀疑。在这些疗法当中,极少会通过比较实验来证明它们不只是装在贴着漂亮植物图片的瓶子里售卖的安慰剂。
1702629801
1702629802 小心潜在变量
1702629803
1702629804 我的钱足够我这辈子花了,只要我不买东西。
1702629805
1702629806 杰基·梅森
1702629807
1702629808 有报道说,在美国,设有赌场的县犯罪率较高。有位大学教师说,在线上课的学生比在教室里上课的学生表现好。政府报告强调,受过良好教育的民众比受教育少的民众赚钱多。最好不要太快下结论,而要先问一句:“有没有什么是他们没告诉我的,却可以用来解释这些事?”
1702629809
1702629810 有赌场的县的确犯罪率较高,但是在城市或是较穷的县,犯罪率也比较高。什么样的县会开设赌场呢?这些县是否在开设赌场之前,犯罪率就已经很高了呢?在线上课的学生学得比较好,但是和在教室里上课的学生比起来,前者的年龄比较大,底子也比较好,因此他们表现好很正常。受教育程度高的人的确赚钱多,但受教育多的人和受教育少的人相比,平均来说前者的父母受的教育也较多,也比较有钱。而且,前者在更好的环境中长大,上更好的学校。这些有利条件让他们接受到更多的教育,即使他们不接受这么多教育,这些有利条件也可能会帮他们赚到很多钱。
1702629811
1702629812 以上这些案例,都涉及两个变量之间的相关性,并且引导我们得出结论,即其中一个变量影响了另一个变量。“赌场会增加犯罪率”和“想变富有就要多读点儿书”,是它们传达的信息。这些信息有可能是正确的,但我们看到的相关性,大部分说不定还可以由隐藏在背景中的一些变量来解释,比如开设赌场的县的本质,以及受教育程度高的人生来就具备的有利条件。好的统计研究会考虑许多的背景变量,这当然需要技巧,不过你至少可以找一找,看它们有没有这样做。
1702629813
1702629814 变异性无所不在
1702629815
1702629816 当事实改变时,我就改变主意。您呢?
1702629817
1702629818 约翰·梅纳德·凯恩斯
1702629819
1702629820 如果你的舌下温度超过37摄氏度,是不是就代表你在发烧呢?也许不是,每个人的“正常”体温都存在差异。你自己的体温在一天当中也会有变化,早上6点时稍高,下午6点时稍低。美国政府宣布上个月的失业率上升0.1个百分点,而新屋开工率下降3个百分点,导致股市波动。股市波动常常是不理性的。政府的数据是根据那些给出乐观预测的样本得出的,是好的估计,但不是百分之百的事实。同样的调查再做一遍,结果会有一些差别。和经济有关的因素原本就会上下波动,影响它的因素包括气候、罢工事件、节假日以及各式各样的其他原因。
1702629821
1702629822 很多人会像股市一样,对数据的一些微小变化做出过度反应,而事实上这些并不是实质性变化,根本微不足道。以下是全美最大的市场研究公司的领导人阿瑟·尼尔森的经验之谈:
1702629823
1702629824 太多商界人士对白纸黑字印出来的数字都深信不疑。他们认为数字就代表“事实”,让他们用“概率”的视角来看事情有点儿困难。他们不了解,数字只是一种简化的表示方法,它描述了一个范围,这个范围表明我们在现有情况下对某个问题的实际了解有多少。
1702629825
1702629826 变异性无所不在。个体之间有差别,对同一个个体多测量几次,结果也会不一样,并且几乎每件事都会随着时间的变化而变化。至于一些所谓的专家对每天股市变化背后的深入原因分析,或者对一场其实是最后一秒才定输赢的球赛,却硬要归咎于输球球队的能力或战术,你尽可以对这些嗤之以鼻。
1702629827
1702629828 统计结论不是百分之百确定的
1702629829
1702629830 数学定律不能百分之百地应用于现实生活,能百分之百地用数学定律来描述的就不是现实生活。
1702629831
1702629832 阿尔伯特·爱因斯坦
1702629833
1702629834 因为变化无所不在,所以统计结论并不是绝对的。大部分中年妇女会定期做乳腺X线检查,以便能及早发现乳腺癌。但是,乳腺X线检查真的可以降低女性死于乳腺癌的风险吗?高质量的统计研究发现,对于50~64岁的妇女来说,乳腺X线检查可以减少26%的死亡率。但这个数字是该年龄阶段妇女的一个平均数字。因为总是存在着个体差异,所以对于不同的妇女来说,结果可能大不相同。有些每年做乳腺X线检查的妇女最后却死于乳腺癌,也有一辈子没做过这种检查的妇女却活到了100岁,最终死于车祸。
1702629835
1702629836 该报告事实上说的是,“乳腺X线检查可以将乳腺癌死亡率减少26%(置信度为95%,置信区间为17%~34%)”。而根据尼尔森的观点,26%这个数字是“某个范围的简化说法,这个范围描述了我们对现时情况的实际了解程度”。在这个案例当中,这个范围是17%~34%,而且我们对它有95%的把握。也就是说,我们相当有把握,但不是百分之百确定。当你阅读新闻报道时,可以找找看有没有诸如“95%的置信度”或“有统计学显著性”等字眼,如果有,就代表这个研究结果虽不能说百分之百确定,但有很大的把握。
1702629837
1702629838 数据可反映社会价值
1702629839
1702629840 要用统计数据骗人很容易。但如果不用统计数据,骗人就更容易了。
1702629841
1702629842 弗里德里克·莫斯特勒
1702629843
1702629844 好的数据确实胜过逸闻。比起逸闻和大声争论未来会发生什么,数据要客观得多。和其他的公开论述相比,统计数据建立在事实的基础上,而且比较科学和理性。对于存在争议的话题,统计数据应该比其他大部分证据受到更多的重视。不过,世界上没有百分之百客观这回事。社会环境会影响我们关于度量什么以及如何度量的决策,从而影响到统计数据。
1702629845
1702629846 以自杀率为例,它在不同国家之间有很大的差别。各国公布的自杀率之所以存在差别,似乎大部分要归因于社会观念,而不是因为自杀率真的有差别。自杀人数是根据死亡证明书计算的。填写死亡证明书(证明书上的细节在不同的国家或不同的州之间有所不同)的官员,对于诸如没有目击证人的溺死或摔死事件,可以决定其是否算作自杀。在视自杀为耻辱的地方,就有较多的自杀被报告为意外死亡。比如,在大部分人信奉天主教的国家,其公布的自杀率就比其他国家低。在日本文化中,有遇到羞辱时就光荣自杀的传统,这种传统使人们不太将自杀视为耻辱,因此日本的自杀事件被报道的比例较高。在有些国家,因为社会价值观的改变,使得自杀事件的数量在增加。一个越来越普遍的看法是,抑郁症应该被视为生理上的疾病,而不是人性的弱点,自杀是这种疾病的悲剧性结局,而不是道德瑕疵。因此,死者家属和医生愿意把自杀列为死者的死因。
1702629847
1702629848 在不像自杀那么敏感的问题上,社会价值观依然可能会影响统计数据。美国的失业率是每个月由美国劳工部劳工统计局用一个很大而且很专业的全国性样本计算出来的。但是,“失业”的定义是什么呢?它指的是,虽然你想工作却没有工作,而且过去两周在积极找工作。如果你过去两周没在找工作,你就不算失业人员,而只是“非劳动人口”。这样去定义失业率,反映了我们加诸工作的价值观。如果换一种定义,我们可能就会得到不一样的失业率数字。
1702629849
[ 上一页 ]  [ :1.7026298e+09 ]  [ 下一页 ]