1701536069
1701536070
现在让我们来仔细看看第二个例子。如果这里列举的平均值要么是中位数要么是众数,我们有可能就高估了平均的学习时间。有些学生很可能花很多时间学习,比如一周30或40个小时,这样就提高了平均数的数值但是却不影响中位数或者众数的数值。学习时间的众数可能花远低于或者远高于中位数,主要取决于花多长时间学习对学生而言最为常见。
1701536071
1701536072
当你见到平均值的时候,一定要记得问一下:“是平均数、中位数还是众数,选择的平均值不同会不会产生什么影响?”要回答这个问题,请想一想平均值的不同含义会对信息的意义造成怎样的改变。
1701536073
1701536074
不仅判断一个平均值是平均数、中位数还是众数非常重要,判定最小数值和最大数值之间的差距(即全距(range))以及每个数值出现的频率(数值分布),常常也显得异常重要。
1701536075
1701536076
下面我们来看一个例子,在这个例子里全距和数值分布就显得非常重要。
1701536077
1701536078
医生对20岁的病人说:你所患癌症的预后不容乐观。患同样癌症的病人存活时间的中位数是十个月。所以剩下来的这几个月你想做什么就做点什么吧,不必有什么顾虑了。
1701536079
1701536080
病人听到医生给出这样的诊断结果,他对自己的未来该做出怎样可怕的展望呢?首先,我们确定的是获得这种诊断的病人有一半不到十个月就去世了,还有一半人存活时间超过了十个月。但是我们并不知道活下来的那部分人的存活时间的全距和数值分布。这些可能显示出有些人甚至是很多人活得远远超过了十个月时间。其中有些人甚至很多人可能活到80岁以上呢!知道病人存活时间的完整分布可能会改变这名癌症患者对未来的看法。
1701536081
1701536082
一般来说,病人应该考虑国内不同的医院对于他的疾病的存活率是不是有不同的全距和数值分布。这样他就应该考虑选择在那家有最乐观的数值分布的医院就诊。
1701536083
1701536084
当我们遇到平均数的时候,了解全距和数值分布的一个总体好处就是这样做会提醒你大多数人或事并不正好符合平均值,与平均值差异极大的结果也在意料之中。例如,在有些健康议案中许多旨在改善我们健康状况的医疗干预措施事先都会给我们看一看其平均获益情况,尽管这项研究中的许多人获益极少或压根就没有获益,甚至有些人会不同程度地受损。
1701536085
1701536086
1701536087
1701536088
1701536090
学会提问(原书第10版) 把一个结论改头换面包装成另一个结论
1701536091
1701536092
有些数据确实能证明一件事,而持论者往往宣称这些数据证明了另一件性质完全不同的事,这时候他们往往在欺骗我们。这些数据压根儿就证明不了它们用来证明的一切!我们有两种策略可以帮你找出这类欺骗。
1701536093
1701536094
一个策略就是对持论者提供的数据视而不见,然后问自己:“什么样的统计数据作为证据在证明他的结论方面会有帮助?”然后,将“所需”的数据和所给出的数据进行比较。如果两者之间难以吻合,你可能就发现了一个数据上的欺骗。下面的例子为你提供一个机会来应用这种策略。
1701536095
1701536096
有种新的减肥药“肥脂畏”(Fatsaway)在帮助肥胖人士减肥方面卓有成效。在临床试验中,服用此药的100例人员当中仅有6例报告有药物副作用。生产这种药物的公司说:“94%的人服用‘肥脂畏’之后有了显著的积极效果,因此我们可以放心地说,我们的药物是市场上疗效最为显著的减肥类药品之一。”
1701536097
1701536098
生产这种药物的公司怎样才能证明其结论——“肥脂畏”作为一种减肥药物能够达到94%的疗效?难道它不应该做一项研究,看多少人服用此药以后体重有所减轻,看这些人体重到底减轻了多少?相反,这家医药公司呈报的数据却是关于副作用出现的频率,他们假定,如果这药物没有出现副作用,那么它帮助人们减肥就会效果明显。这家公司证明了一件事(相对较少的人服用此药以后报告说有副作用),却拿它作为另一件事的结论(“肥脂畏”帮助人们减肥效果显著)。从这个例子当中得到的一个重要教训就是,我们要加倍注意统计数据的措辞和结论的措辞,看看二者是不是指的同一件事情。如果不是,作者或演说者就很可能是在用数据说谎。
1701536099
1701536100
知道什么样的数据证据应该用于支持一个结论是很难的。因此,另一个策略就是不急于去看作者的结论而是先非常细心地检查作者的数据,然后问自己:“从这些数据我们可以得出什么合适的结论?”然后拿你的结论和作者的结论相比较。用这个策略来检验一下下面这个例子。
1701536101
1701536102
大约半数的美国人欺骗了自己的另一半。研究人员最近在一家购物中心采访了很多人。在接受采访的75人中,有36人坦承他们有朋友曾承认欺骗过自己的约会对象。
1701536103
1701536104
你有没有质疑这个例子一开始得出的结论?大约一半人在某个特定地点承认自己有朋友告诉过自己他们在和他人约会或交往过程中至少有过一次的欺骗行为。你有没有看出数据所证明的东西和作者的结论之间存在巨大差异?如果你看出来了,那你就发现了这位作者是如何利用数据来进行撒谎欺骗的。
1701536105
1701536106
1701536107
1701536108
1701536110
学会提问(原书第10版) 省略数据也是欺骗
1701536111
1701536112
统计数据经常因为不完整而欺骗我们。因此,另一个在数据推理中找到缺陷非常有用的策略就是问一问:“在你判断数据的影响力之前还需要哪些进一步的信息?”让我们先看看下面的例子,诠释一下这个问题所派的用场。
1701536113
1701536114
(1)大公司正在将市中心地带的小镇气息破坏殆尽。就在去年,城里的大公司的数目增长了75%。
1701536115
1701536116
(2)尽管大家都挺害怕,但跳伞运动其实比其他活动比如说驾驶汽车要安全得多。拿某一个月的时间来做比较,这段时间里,洛杉矶有176人死于车祸,而死于跳伞事故的却只有3人。
1701536117
1701536118
(3)艾滋病预防项目需要较大的资金投入。2009年,有54 000人饱受艾滋病的折磨。
[
上一页 ]
[ :1.701536069e+09 ]
[
下一页 ]