1705318110
1705318111
如果我们处理统计数值,那么我们必须查明是谁收集的统计数据,使用了什么处理手段,有多少人参与调查,这些人是如何挑选的,问了哪些具体的问题,这些问题是如何使用“暗示”章节所描述的技巧的。
1705318112
1705318113
首先,让我们仔细检查用以描述和操纵一系列数字的不同方法。假定一家小型企业拥有11名兼职雇员,他们的年薪如下:
1705318114
1705318115
1—6000美元
1705318116
1705318117
2—6000美元
1705318118
1705318119
3—7000美元
1705318120
1705318121
4—8000美元
1705318122
1705318123
5—8000美元
1705318124
1705318125
6—12 000美元
1705318126
1705318127
7—23 000美元
1705318128
1705318129
8—24 000美元
1705318130
1705318131
9—24 000美元
1705318132
1705318133
10—24 000美元
1705318134
1705318135
11—25 000美元
1705318136
1705318137
该企业可以把所有年薪加在一起除以11,然后得到数字15 181美元。他们可以把这个数字称为平均数。这样的平均数称为算数平均数。必须注意,这样一个数字在此背景下既具迷惑性又毫无价值。该企业中没有人的年薪是15 000美元;人们挣的或多或少,工作时间也不一样。
1705318138
1705318139
算数平均数必须伴随两个其他的平均数:众数和中位数。众数是一系列数字当中出现频率最高的一个或多个数值。在上述例子中实际上有两个众数——大多数人所挣年薪要么是大约7000美元要么是大约24 000美元。比起算数平均数,众数通常更有价值,有更多的相关性。
1705318140
1705318141
中位数是将数字从高到低或从低到高排列之后排在中间位置的数字。上述系列数字的中位数是12 000美元;它也不是个特别有用的数字,但它确实能帮助我们建立平均数的背景。
1705318142
1705318143
还有两种其他方法可以帮助建立数字的背景:全距和频数分布。上述例子中的全距是19 000美元,即从6000美元到25 000美元;频数分布告诉我们有2人挣6000美元,1人挣7000美元,2人挣8000美元,1人挣12 000美元,1人挣23 000美元,3人挣24 000美元,还有1人挣25 000美元。
1705318144
1705318145
当把算数平均数理解为众数时,一个常见的谬误就产生了。“多好的公司啊,”有人可能这样评论,“平均薪水这么高。”“荒谬!”你肯定这样想,除非你知道此平均数是指众数而不是指算数平均数。
1705318146
1705318147
因此,当处理平均数时,区分算数平均数和众数非常有必要,如果你能确定中位数、频数分布和全距则更佳。
1705318148
1705318149
百分率也能导致误解。“在科德市长在任期间,腐败已经下降了50%。”一位科德市长的支持者如此声称。这种言论也许是真实的,但也许是从4个腐败人员减少到2个——并非多么明显的区别。然而,百分率比数字听起来更令人印象深刻。有人还可以让百分率看起来更加非同凡响:“上一任治理期间,腐败案例比现任治理期间高出200个百分点。”200个百分点听起来非同小可。事实上,两任市长治理期间的腐败水平并没有多大区别。
1705318150
1705318151
还有误导性取样技巧。“60%的人支持麦考密克。”这可能是真实的,但投票也许发生在共和党人集中的区域,大部分居民都支持共和党候选人麦考密克。这种骗术是来自有限取样的一个例子。投票人的取样并不能代表全部投票选民。
1705318152
1705318153
类似于有限取样的是小样本取样:“60%的人支持米勒。”同样,这也可能是真实的,但只有30人参与投票。在这30人中,18人支持米勒。但是30人并不足以形成有意义的统计数据。30人不具备所有投票人口的代表性。
1705318154
1705318155
然后还有模糊的统计数字:“最近的调查表明,更多医生针对普通头疼开出的药方更偏向于Z品牌而非其他品牌。”该词汇“最近的调查”可能隐藏了大量信息,这种词汇不具备权威论证,除非提供更多信息。还有误导性统计数字:“最近的调查表明更多人宁愿选择Z品牌而非其他品牌。”可能是真实的,但看看以下数据:
1705318156
1705318157
85人更喜欢A品牌
1705318158
1705318159
80人更喜欢B品牌
[
上一页 ]
[ :1.70531811e+09 ]
[
下一页 ]