1701039280
1701039281
因为经过简化,这个例子非常粗糙,但是与打着会计名义所做的那些事相比,这根本算不了什么。如果放在一个大型公司里,雇员包括从打字员到年终奖几十万美元的董事,所有的事实都可以以这种方式被掩盖起来。
1701039282
1701039283
1701039284
1701039285
1701039286
1701039287
1701039288
1701039289
所以当你看见平均工资时,首先要问问:是什么样的平均工资,包括哪些?美国钢铁公司(The United States Steel Corporation)曾披露,从1940年到1948年间,其雇员的周工资增长了107%。的确如此,但当你注意到1940年该公司的雇员包括了一大批兼职员工时,你就能发现这个奇妙的增长没那么吸引人了。如果你第一年只做兼职,第二年却做全职,你的收入将会翻一番。但这并不能表明你的工资率增长了。
1701039290
1701039291
也许你曾在报纸上读到,1949年美国家庭的平均年收入为3 100美元。除非你知道这个所谓的“家庭”指的是什么,而且你也知道用的是哪一种平均数(包括谁说的?他是怎样得知的?这个数据有多精确?),否则,这个数据就根本说明不了什么问题。
1701039292
1701039293
3 100美元这个数据恰好来自美国人口普查局(The Bureau of the Census)。如果你有这份报告,你就不难找到所需要的其他信息:这个数据是一个中位数;“家庭”指的是两个或两个以上具有亲属关系的人居住在一起。(如果独居的人也算是家庭,那么中位数就会降至2 700美元,这可大不相同。)如果你回过头再看看报告中的图表,你会发现这个数据是基于抽样调查得出,该抽样调查以19/20的概率保证真实数据落在3 107±59美元的范围内。再对3 107美元取整数后得到3 100美元。
1701039294
1701039295
这个概率和偏差一同构成了一个非常漂亮的估计值。普查局的人有足够的技术和资金来进行抽样调查,从而得出如此精确的结果。他们也许没有什么私心。但并不是你看见的所有数据都出自如此良好的环境,也不是所有的数据都附有能证明它们精确与否的详细信息。关于这一点我们将在下一章详细探讨。
1701039296
1701039297
同时,你也许会对《时代》杂志上“编者的话”中的一些项目有所质疑。他们这样描述新的订阅者:“平均年龄(中位数)为34岁,家庭平均年收入为7 270美元……”更早时候,《时代》杂志的调查发现“平均年龄(中位数)为41岁,家庭平均年收入为9 535美元……”问题自然而然就来了:为什么两次说年龄都是中位数,却没有限定平均年收入是哪一种平均数呢?也许这里使用的是均值,这样就可以通过更高收入的读者群来吸引广告商。
1701039298
1701039299
1701039300
1701039301
1701039302
你也可以对第一章开头提到的所谓“1924届耶鲁毕业生的高收入”考究一番,他们究竟用的是哪一种平均数?
1701039303
1701039304
1701039305
1701039306
1701039308
1701039309
统计数据会说谎:让你远离数据陷阱
1701039310
1701039311
1701039312
1701039313
1701039314
1701039315
统计数据会说谎:让你远离数据陷阱
1701039316
1701039317
报纸上大字标题历历在目:用户反映,使用多克斯牙膏后蛀牙减少了23%!你也不想遭受这23%的痛苦,所以你继续往下读。接着你发现,这个结论来自某个“独立”实验室,并且还附有注册会计师的证明。你还有什么不放心的吗?
1701039318
1701039319
但显而易见,你不是一个容易上当受骗的人,也并非过于乐观,你的经验告诉你——某种牙膏不会比其他牙膏好很多。那么,多克斯公司的人是怎么得出这个结论的?他们明目张胆地说谎并且还能得逞吗?不,他们不必说谎,还有更简单、更有效的方法。
1701039320
1701039321
这个例子中主要的技巧在于使用了有限的样本——也就是说数据不够充分,但对多克斯公司的人来说却是恰到好处。如果你看见小字印刷的部分,你会发现参加测试的用户仅有12人。(你还得感谢多克斯公司给了你这个冒险的机会。有些广告商会直接略去这些信息,就连最资深的统计学家也猜不透他们到底使用的是哪种诡计。多克斯公司使用的12人样本还不算太糟。几年前,市场上出现过一种“科尼斯博士”牌的牙粉,该产品声称“在治疗龋齿方面效果显著”。该产品中含有尿素,实验证明尿素对治疗龋齿的确有效。但是,这个实验的结果先入为主,而且只做了6个个案测试,这使得整个实验成了一个无稽之谈。)
1701039322
1701039323
但是让我们回过头看看,多克斯公司如何轻而易举地就做出了一个毫无破绽的大字标题,还附有权威证明。让一个小组的人数清自己的蛀牙数量,然后坚持在6个月内使用多克斯牙膏,这必然会出现下列三种情况的其中之一:蛀牙明显增多、明显减少和没有变化。如果得出第一种或第三种结果,多克斯公司就要把这个数据归档(放到看不见的某个地方),然后接着实验。在机缘巧合之下,他们迟早都会得出一个重大成果,这个成果值得登报,甚至用整版广告刊出。无论测试者使用的是多克斯牙膏或是小苏打,哪怕用的还是他们以前的洁牙剂,都会出现这个结果。
1701039324
1701039325
使用规模较小的实验小组的关键意义在于:如果实验组的规模过大,那么碰巧之下产生的结果会是微不足道的,甚至不值得用大字标题刊出。试想一个只减少了2%蛀牙的牙膏销量能有多好?
1701039326
1701039327
在样本规模很小的情况下,怎样才能在巧合之下得出一个说明不了任何问题的结果?你可以亲自动手做一个花费无几的小实验来验证一下。抛出一个硬币,有几次它落地时会头像朝上?大家都知道,这个概率当然是50%。
1701039328
1701039329
那么,让我们来检验一下。刚才我抛了10次硬币,其中有8次头像朝上,这证明了抛硬币时头像朝上的可能性会有80%。好吧,牙膏的统计数据也是如此。现在,你自己试试。你也许会得到一个一半对一半的结果,也许你不会;你的结果很可能像我的一样,远非一半对一半这么简单。但如果你有足够耐心能抛上1 000次硬币,你多半(尽管不一定)就能得出一个非常接近50%的结果——这个结果才是最真实的概率。只有试验的样本数目足够庞大时,平均数定律才会是一个有用的描述或猜测。
[
上一页 ]
[ :1.70103928e+09 ]
[
下一页 ]