打字猴:1.702642915e+09
1702642915 上述例子的分析对象应该是人,而不是国家。1980〜2000年这20年的时间到底发生了什么?回想一下刚刚那个虚构的学校例子。世界上的大部分穷人恰好都生活在两个大国里,而这两个大国在融入全球化的过程中都经历了经济的飞速发展。正确的分析得出了一个截然不同的结论:全球化有利于全世界的穷人。《经济学人》杂志指出:“如果你考虑的是人而不是国家,那么全球不平等现象正在迅速减少。”
1702642916
1702642917 美国的两家电信业巨头美国电话电报公司和威瑞森电信最近卷入了一场广告之争,说白了也是因为模棱两可的描述所引发的。这两家公司都提供移动通信服务,对于绝大多数的手机用户来说,他们最关心的问题无非就是服务网络的覆盖范围和通话质量,最不愿看见的就是在需要拨打或者接听电话时却没有信号。因此,从逻辑上讲,要比较这两家公司孰好孰坏,只要看它们各自通信网络的规模和质量就行了。为了迎合消费者对于更大、更好的网络覆盖的需求,两家公司在衡量这一看不见、摸不着的需求时采取了不同的分析指标。威瑞森电信公司发动了一场声势浩大的广告战略,四处兜售其无所不在的网络覆盖,给消费者留下这样一个印象:在辽阔的美国国土上,威瑞森电信公司的基站几乎遍布全美国的各个角落,而与之形成对比的,是美国电话电报公司的相对零碎的地理覆盖。威瑞森电信公司所选择的分析单位是网络覆盖的地理范围,这是因为这家公司的确在这方面要强一些。
1702642918
1702642919 与此同时,美国电话电报公司也发动了反击战,选择了另一个分析单位。在其巨大的广告牌上赫然写着“美国电话电报公司能够满足97%的美国人的通信需求”,注意这里的用词是“美国人”,而不是“美国”。美国电话电报公司所强调的重点在于,绝大多数的美国人并不住在蒙大拿州的偏远乡村或是亚利桑那州的沙漠之中,既然美国的人口在地理上来说并不是平均分布的。这则广告的言下之意就是,一个好的通信
1702642920
1702642921 服务网络的关键就在于,将服务重点放在那些手机用户真正生活和工作的区域,而不是他们偶尔才会去野炊的地方。但由于我经常要回新罕布什尔的乡下,因此在这个问题上,我可能还是会选择威瑞森电信公司作为我的移动电话服务商。
1702642922
1702642923 我们的“老朋友”平均数和中位数同样会被心术不正的人利用。在上一章的内容中我们介绍了这两个概念,希望大家还能回忆起来,无论是平均数还是中位数,都是衡量一组数据的“中间位置”或“中心趋势”。平均数就是所有数据求和之后再除以个数(3、4、5、6、102的平均数是24)。中位数就是一组数据最中间的那个点,有一半数据位于这个点之前,有一半数据位于这个点之后(3、4、5、6、102的中位数是5)。现在,聪明的读者一定会注意到24和5之间存在着巨大的差异。所以,如果出于某种考虑,想要让这组数据在描述时显得数值大一些,那么我会选择求它们的平均数;但如果我想让数值看上去小一些,我肯定会将关注点放在中位数上。
1702642924
1702642925 现在,我们来看一下这在现实生活中是怎么操作的。以美国前总统小布什的减税政策为例,根据小布什政府的说法,这一政策将惠及绝大多数的美国家庭。相关政府官员指出,在这项政策推行之后,将会有9200万美国人享受减税待遇,人均减税额超过1000美元(具体数字应该是1083美元)。但这个关于减税政策的概括准确吗?《纽约时报》评价说:“数据本身并没有撒谎,只不过有些数据没有发出声音罢了。”
1702642926
1702642927 是不是会有9200万美国人将享受减税待遇?答案是肯定的。
1702642928
1702642929 那么,这些人中的大部分人都可以少缴纳约1000美元的税款吗?不是的。因为减税额的中位数还不足100美元。
1702642930
1702642931 只有数量相对少的巨富们才有资格享受大额减税,而正是这些人拉高了平均值,让人均减税额看起来比绝大多数美国人真正享受到的要高。中位数对异常值并不敏感,因此在这个例子中,如果要看小布什政府的减税政策对普通家庭的影响,中位数可能会是一个更为准确的描述性数据。
1702642932
1702642933 当然,也正是因为中位数对异常值不敏感,所以在某些情况下中位数同样会掩盖事实真相。假设你患上了某种不治之症,好消息是有一种新药刚刚研发出来,可能会对你的病产生积极疗效,坏消息是这种药的价格非常昂贵,而且副作用有很多。“真的有效吗?”你会对这种药充满疑惑。医生告诉你这种新药能够延长患此疾病的病人的“半数预期寿命”(也就是这些病人寿命的中位数)达两周。这根本就算不上是什么好消息,相比起那么贵的药价和不良反应,这两周的寿命不要也罢。同时,你的保险公司也拒绝为这项治疗承担费用。这是一个基于半数预期寿命的典型案例。
1702642934
1702642935 但在这个例子中,中位数或许会成为一个相当有误的数据。假设有许多病人对这种新药完全没反应,但同时也有相当数量(30%~40%)的病人完全治愈了。然而,后者的成功并不能在中位数中得到体现(虽然接受新药治疗的病人的平均寿命看上去非常令人振奋)。对你而言,与你自己高度相关、真正影响你决定的反而是那些接受了新药治疗并活了很多年的病人,也就是统计学里的异常值。而且,这并不是一个虚构的例子。进化生物学家史蒂芬·杰·古尔德曾经被诊断出患有某种癌症,他的半数预期寿命只有区区8个月。但20年过去了,古尔德死于另一种不相关的癌症。古尔德生前写过一篇非常有名的文章,题目为“中位数不等于真信息”,他在文章里指出了他只能活8个月是一个错误结论,并表示是他头脑里积累的统计学科学知识将他从错误的结论中拯救了出来。中位数的定义告诉我们有1/2的病人活不到8个月,但另外1/2的病人至少可以活8个月,或者比8个月
1702642936
1702642937 的时间更长(甚至是活到老),其死亡分布是“右偏”的。因此,如果你恰好患上了这种病,这一数据的意义要比一个单纯的技术术语丰富得多。
1702642938
1702642939 上述例子表明,中位数的决定性特征——不考虑数据距离中间位置有多远或是多近,而是关注它们是高于中间位置还是低于中间位置——反而成为它的弱点。与之相反,平均数恰恰是由数据分布决定的。从准确性的角度来看,平均数和中位数孰取孰舍,关键就在于这个数据分布里的异常值对事实的真相是起到扭曲的作用,还是其重要的组成部分。再次强调,判断比数学更重要。当然,没有人强制你一定得选中位数或平均数,任何一个复杂综合的数据分析都会包含这两个数据。所以,当只有其中一个数据出现的时候,你就要注意了,有可能只是出于言简意赅的考虑,但也有可能是某些人别有用心地想用数据“说服”你。
1702642940
1702642941 上了一定年纪的人或许会记得一部《疯狂高尔夫》的电影,里面的两位主演分别是塞维•蔡斯和泰德•奈特,他们在高尔夫球场的更衣室里有过这么一段对话:
1702642942
1702642943 泰德:刚刚打得怎样?
1702642944
1702642945 塞维:啊,我没记数。
1702642946
1702642947 泰德:那你用什么跟别人比啊?
1702642948
1702642949 塞维:身高。
1702642950
1702642951 我引用这段电影台词的目的不是想说明它有多幽默,而是想说其实统计学里也有很多这类“苹果和橙子”作比较的把戏。如果你想比较伦敦和巴黎的酒店房间价格,可能会让你6岁大的孩子登录网站搜索——电脑方面你永远不是孩子的对手,然后你的孩子向你汇报巴黎的房价更贵一些,每晚的价格约为180欧元,而相同档次的房间在伦敦每晚只需要150英镑。
1702642952
1702642953 此时,或许你会滔滔不绝地向孩子解释英镑和欧元之间的区别,然后让他回去重新查找这两种货币之间的汇率,这样你就能对两个城市的房价作一个有意义的比较。这个例子其实在现实中也挺常见,我的女儿看见我在印度用100卢比买了一壶茶,于是她就问我为什么在印度无论买什么东西都那么贵。显然,在我们将不同国家的货币转换成同一种货币单位之前,比较这些货币上印着的数字是没有意义的。英镑和欧元的汇率是多少?美元和卢比的汇率又是多少?
1702642954
1702642955 这似乎是一节痛苦的启蒙课,虽然事实很明显,但却经常被忽略,尤其是政客和好莱坞制片商。这些人当然知道欧元和英镑之间的差别,但就好比苹果和橙子的例子,他们反而会忽略一个更为细微的因素:通货膨胀。今天的1美元和60年前的1美元的价值是不一样的:今天的1美元能买到的东西更少。由于通货膨胀的存在,1950年花1美元能买到的东西在2011年可能要花9.37美元。因此,在没有考虑通货膨胀因素的情况下,任何有关1950年与2011年的金钱比较都是不准确的,而且比欧元与英镑的比较更加离谱儿,因为欧元和英镑的价差比1950年的美元与2011年的美元的价差还小。
1702642956
1702642957 经济学家甚至为这一重要的现象冠以专业术语,以表示相关数据是否考虑了通货膨胀因素。名义数据就是没有就通货膨胀做出调整的数字,比较1970年某项政府项目的名义花费与2011年政府在相同项目上的名义花费,实际上看的仅仅是政府财政部在这两年所开出的支票的票面金额,并没有考虑1970年的1美元能买的东西比2011年买到的东西多。假设政府在1970年时为老兵的住房补助项目投入了1000万美元,到了2011年,政府在此项目上投人了4000万美元,联邦政
1702642958
1702642959 府在这个项目上的努力实际上是退步了。花费的金钱在名义上的确是增多了,但这并没有反映出美元价值的变化。1970年的1美元相当于2011年的5.83美元,也就是说’政府2011年需要在老兵的住房补助项目上投入5830万美元才是与1970年的1000万美元持平。
1702642960
1702642961 实际数据是考虑了通货膨胀因素并做出调整的数字。最常见的方法就是将所有数据统一换算成一个相同的单位,如2011年的美元,这样就可以将“苹果与橙子”之间的比较变为“苹果与苹果”的比较。包括美国劳工统计局在内的许多网站,都提供简易的通胀计算器,供我们对不同时期的美元价值进行比较。下面是一张美国政府最低工资图,上面标出了最低工资的名义值及其实际购买力(都换算成2011年的美元)。通过这张图,我们不难发现考虑了通货膨胀因素并做出调整的数据会产生非常不一样的效果。
1702642962
1702642963
1702642964
[ 上一页 ]  [ :1.702642915e+09 ]  [ 下一页 ]