打字猴:1.70103925e+09
1701039250 在处理数据时,例如研究与人体特点相关的数据,不同平均数的取值会非常接近,具备“正态分布”的特点。如果画一张曲线图来代表正态分布,那么画出的图形就像一口大钟,图中均值、中位数、众数都落在同一点上。
1701039251
1701039252 因此,要描述男性平均身高,用这三个平均数中的任何一个都可以。但你要描述这些男性的经济状况,情况可就大不相同了。如果要你列出某个城市中所有家庭的平均年收入,你也许会发现他们的年收入从几百、几千到50 000美元不等。极少数的家庭年收入很高,而95%的家庭年收入则低于10 000美元。将10 000美元这个数据放在曲线图的左侧,这时曲线图的形状并不是像一口大钟那样对称,而是有点倾斜,看起来有点像儿童用的滑梯。梯子陡直地突起到一个顶点,滑道则缓缓接近地面。这时均值和中位数相差甚远。在这种对比下,你就会明白为何一年的平均数(均值)和另外一年的平均数(中位数)的差别竟会如此之大。
1701039253
1701039254 在我卖给你房子的街区,这两个平均数的差别就非常大,因为曲线图上分布明显倾斜。假设你的邻居都是小农场主、在附近村庄干活拿工资的人,还有依靠养老金生活的退休老人,但是有三户邻居是在这里度周末的百万富翁,他们一下就能拉高这个街区的总年收入,因此平均年收入的算术平均数就变得很大,形成了一个年收入很高的“假数据”。但事实上,这个街区每家每户的年收入都远远低于这个数据。所以,这种假数据只是个玩笑或是一种修辞而已:几乎所有住户的年收入都低于这个平均数。
1701039255
1701039256
1701039257
1701039258
1701039259 如果你看到某位公司经理或者老板宣称公司员工的平均收入很高时,你就知道这个数据也许能说明一些问题,也许不能,这就是原因所在。如果这个平均数是中位数,你就能从中得知一些重要信息:一半的员工收入比这高;另一半的员工收入比这低。但如果这个平均数是均值的话(请相信我,如果没有特别限定平均数的性质,一般指的就是均值),你就会再清楚不过:说是45 000美元的平均年收入,其实主要都是老板的,员工们的工资非常低。“5 700美元的平均年收入”隐含了两条信息:每年仅为2 000美元的员工低收入,还有老板以巨额薪水的形式抽走的利润。
1701039260
1701039261 让我们再仔细研究一下这个数据。第28页的图表示各个阶层的收入情况。老板可能会通过使用那个欺骗性的均值,把情况描述成“平均年收入为5 700美元”。但是,众数却更能说明问题:这家公司大多数人的年收入为2 000美元。当然,中位数比其他任何一个数据都能揭示更多:一半的人年收入高于3 000美元,另一半则低于3 000美元。
1701039262
1701039263 许多公司的公告中都藏有一个高明的骗局,所以往往是表面情况越好,事实真相越糟。我们不妨用个简单的方法来证明。
1701039264
1701039265 假设你与另外两个合伙人经营一家小型制造业工厂,年底算来收入颇丰。你支出了198 000美元用于90位员工的工资。他们制造并装运椅子,或任何你公司生产的产品。你们三位老板的年薪为每人11 000美元。这时你们发现今年还有45 000美元的利润可以平分。那么,对此你会怎样描述?为了表达得清楚明白,你采用了平均数的办法。由于所有的员工都做的是相同的工作,拿的工资也差不多,所以你是用均值还是中位数并无多大差别。下面是你计算得出的结果:
1701039266
1701039267 员工的年平均工资:2 200美元
1701039268
1701039269 老板的年平均薪水和利润:26 000美元
1701039270
1701039271 这真是天壤之别,对不对?那就换个说法。
1701039272
1701039273 从利润中抽出30 000美元,把它当作奖金分给三位老板。这次计算的是工资的平均水平,其中包括你和你的合伙人。注意,这次一定要使用均值。
1701039274
1701039275 所有人的年平均工资(或薪水):2 806.45美元
1701039276
1701039277 老板的年平均利润:5 000美元
1701039278
1701039279 哈!这看起来好多了。虽然还能弄得更好看,但这也很不错了。工资和利润的总和中,利润所占的比例不到6%,如果愿意的话,你还可以继续做这种数字游戏,看看你会不会更喜欢。总之,现在你得到了可以公开的数据,把它贴在公告栏上吧,或者在和工人交涉的时候用它。
1701039280
1701039281 因为经过简化,这个例子非常粗糙,但是与打着会计名义所做的那些事相比,这根本算不了什么。如果放在一个大型公司里,雇员包括从打字员到年终奖几十万美元的董事,所有的事实都可以以这种方式被掩盖起来。
1701039282
1701039283
1701039284
1701039285
1701039286
1701039287
1701039288
1701039289 所以当你看见平均工资时,首先要问问:是什么样的平均工资,包括哪些?美国钢铁公司(The United States Steel Corporation)曾披露,从1940年到1948年间,其雇员的周工资增长了107%。的确如此,但当你注意到1940年该公司的雇员包括了一大批兼职员工时,你就能发现这个奇妙的增长没那么吸引人了。如果你第一年只做兼职,第二年却做全职,你的收入将会翻一番。但这并不能表明你的工资率增长了。
1701039290
1701039291 也许你曾在报纸上读到,1949年美国家庭的平均年收入为3 100美元。除非你知道这个所谓的“家庭”指的是什么,而且你也知道用的是哪一种平均数(包括谁说的?他是怎样得知的?这个数据有多精确?),否则,这个数据就根本说明不了什么问题。
1701039292
1701039293 3 100美元这个数据恰好来自美国人口普查局(The Bureau of the Census)。如果你有这份报告,你就不难找到所需要的其他信息:这个数据是一个中位数;“家庭”指的是两个或两个以上具有亲属关系的人居住在一起。(如果独居的人也算是家庭,那么中位数就会降至2 700美元,这可大不相同。)如果你回过头再看看报告中的图表,你会发现这个数据是基于抽样调查得出,该抽样调查以19/20的概率保证真实数据落在3 107±59美元的范围内。再对3 107美元取整数后得到3 100美元。
1701039294
1701039295 这个概率和偏差一同构成了一个非常漂亮的估计值。普查局的人有足够的技术和资金来进行抽样调查,从而得出如此精确的结果。他们也许没有什么私心。但并不是你看见的所有数据都出自如此良好的环境,也不是所有的数据都附有能证明它们精确与否的详细信息。关于这一点我们将在下一章详细探讨。
1701039296
1701039297 同时,你也许会对《时代》杂志上“编者的话”中的一些项目有所质疑。他们这样描述新的订阅者:“平均年龄(中位数)为34岁,家庭平均年收入为7 270美元……”更早时候,《时代》杂志的调查发现“平均年龄(中位数)为41岁,家庭平均年收入为9 535美元……”问题自然而然就来了:为什么两次说年龄都是中位数,却没有限定平均年收入是哪一种平均数呢?也许这里使用的是均值,这样就可以通过更高收入的读者群来吸引广告商。
1701039298
1701039299
[ 上一页 ]  [ :1.70103925e+09 ]  [ 下一页 ]