1702642990
2. 《星球大战IV》(1977)。
1702642991
1702642992
3. 《音乐之声》(1965)。
1702642993
1702642994
4. 《外星人E •T》(1982)。
1702642995
1702642996
5. 《十诫》(1956)。
1702642997
1702642998
以剔除通胀因素的实际票房成绩来看,《阿凡达》只排到了第14位,《怪物史莱克II》则落到了第31位。
1702642999
1702643000
有的时候即使是拿苹果与苹果进行比较,也可以毫不费力地欺骗他人。上一章的内容里曾经讲过,统计学的一个重要角色就是描述数量随着时间推移所发生的变化。我们缴的税是不是越来越多?与2012年相比,2013年的汉堡销量如何?饮用水中的砷含量到底降低了多少?我们经常使用百分率来描述这些变化,因为百分率能够让我们相对直观地有一个比例和背景的感受。很多人会理解饮用水中的砷含量降低了22%是什么意思,但能感知每一单位水中减少I微克砷(绝对减少量)到底是多是少的人就没几个了。百分率不会撒谎,但它们会夸大其辞。让增长出现“爆炸”的方法之一就是与一个非常低的起点进行百分率比较。我住在伊利诺伊州的库克郡,一天我得知我缴纳的税款中用于支持库克郡郊区肺结核疗养院的比例上升了527%!我着实吃了一惊。愤怒的我马上开始筹划一场大型的抗税集会,而就在此时,我才知道这一变化给我增加的负担还不够一个火鸡三文治的钱。肺结核疗养院每年接收的病人才100多例,并不是一个规模庞大或昂贵的机构。据《芝加哥太阳报》报道,对于一个普通家庭来说,其支付的税额仅仅是从1.15美元上升到了6美元。研究人员有时候会特别指出某项增长数据是由“一个较低的基数”得出的,哪怕是很小的一点儿增长在进行百分率比较时,看上去都会很可观。
1702643001
1702643002
除此之外,百分率的另一面也是很可怕的,那就是一个庞大数额的微小比例也会是一个很大的数字。如果美国国防部部长说,2013年的军费开支仅增长4%—这看上去可是一条好消息啊!作为纳税人的我们,是不是应该庆祝?其实并不尽然,因为美国的国防预算是在7000亿美元左右,4%的比例就是280亿美元,这笔钱能买多少个火鸡三文治啊!事实上,区区4%的军费开支就已经超过了美国国家航空航天局(NASA)的全部预算,相当于美国劳工部和财政部预算的总和。
1702643003
1702643004
同样的,想象一下你有一个菩萨心肠的老板,出于公平的考虑,他决定2013年为公司的每一位员工加薪10%——多么慷慨的决定啊!只不过有一点,老板的年薪是100万美元,而你每年只挣5万美元,老板将会得到10万美元的加薪,而你只有0.5万美元的加薪。“2013年每个人都将获得10%的加薪”听上去要比“我的加薪是你的20倍”好受太多了——虽然这两句话都没错。
1702643005
1702643006
只要是对一段时间内的数字变化进行比较,就肯定离不开一个起点和一个终点,但我们有时候能通过操纵这些点来影响信息的表达。曾经有一个教我的教授,他对美国共和党和民主党操纵数据的伎俩十分清楚,尤其是在军费开支的问题上,他指出就算是面对完全相同的数据,不同的分析方法也能够产生不同的效果,既可以用来取悦民主党的支持者,也不会让共和党的拥护者失望。因此,在准备课件时他会做两个版本的幻灯片,当为共和党人上课时,就拿出“共和党版”的课件,为民主党人上课时,自然就会换成“民主党版”的课件,但里面的数据是完全相同的,不同的只是组织数据的方式。就比如今天的这节课他的听众主要是共和党人,他的幻灯片上就会出现下面有关罗纳德•里根(共和党人)总统执政期间的军费开支统计图。大家都清楚里根为美国赢得了冷战,对国防安全做出了卓越贡献。在看着这些数字的时候,无人不为里根总统处理政务时所表现出的钢铁般的决心击掌喝彩。
1702643007
1702643008
1702643009
1702643010
1702643011
图3-3 美国军费开支,1981~1988年
1702643012
1702643013
面对美国民主党人时,我的这位教授还是用相同的(名义)数据,但在时间跨度上稍长一些。他对这群听众指出,吉米·卡特(民主党人)总统是开启国防建设的当之无愧的先驱。正如下面的这张“民主党版”的幻灯片所示,卡特掌权的1977〜1980年间,美国的军费增长趋势与继任的里根总统大同小异,感谢上帝让来自安纳波利斯的前海军军官吉米·卡特带领美国走上了军事自强之路!
1702643014
1702643015
1702643016
1702643017
1702643018
图3-4 美国军费开支,1977~1988年
1702643019
1702643020
资料来源:http://www.usgovernmentspending.com/spend.php?span=usgs302&year=1988&view=l&expand=30&expandC=&units=b&fy=fyl2&Iocal=s&state=US&pie=#usgs302
1702643021
1702643022
虽然统计学的要点在于为我们所关心的事物描绘一幅有意义的画面,但是在许多时候我们同样希望能够为这些数字做些什么。美国职业橄榄球联盟的球队希望获得四分卫成绩的简单统计,这样他们就能在众多大学生中寻找到天才球员,企业通过考核指标来提拔那些有价值的员工.开除那些纯粹混日子的人。在商界流传着一句至理名言:“你无法管理你无法衡量的事物”。这句话千真万确,但你最好要保证你所衡量的,正是你努力想去管理的。
1702643023
1702643024
谈到学校的质量,这是一个必须予以衡量的关键问题,因为我们都希望奖励并效仿“好”学校,惩罚或整顿“差”学校(具体到学校内部,我们在衡量教师的教学水平问题上也面临类似的难题)。考核学校和教师最常用的方法就是看学生的考试分数,统考结束后,学生的优异成绩就是教师和学校最好的金字招牌;与之相反的,糟糕的成绩无疑会释放出一个清晰的信号:相关教师应该被辞退,而且越早辞退越好。这样看来,仅凭考试分数我们就能彻底改善公共教育系统了,对吗?
1702643025
1702643026
错。在评价教师和学校时,如果只看考试分数是会铸成大错的。不同学校的学生,他们的背景和能力是很不一样的,比如说,学生父母的教育程度和收入会对孩子的成绩产生不可忽视的影响,不论孩子上的是哪所学校。在这里,我们所缺少的那个数据恰好就是解答这个问题唯一需要的:学生的学业表现有好有差,但其中有多少比例要归功或归咎于学校(或所在的班级)呢?
1702643027
1702643028
从小就生活在衣食无忧、书香门第家庭里的孩子,一般来说从进入幼儿园的第一天起就有可能会比别的孩子的成绩好。相反的情况同样成立,有些学校的学生天资平平,虽然教师教得很好,但是学生的成绩还是处在一个低水平上,如果没有这些老师的付出,那些学生的成绩会更加惨不忍睹。所以,我们需要在学校,甚至班级层面上将一些“附加值”纳入考核。学生成绩的绝对水平对于解答我们的问题没有意义,我们想知道的是这些学生的表现中有多少是受到了学校和教师的影响,我们想要评估的其实是这些教学因素。
1702643029
1702643030
有人会说这并不难,只需要在开学时给学生安排一场摸底考试即可,再将这次考试的成绩与入学之后的考试成绩进行对比,就能够判断学生的学业是进步了还是退步了,并由此对其所在的学校或班级进行评价。
1702643031
1702643032
但这种方法还是错误的。不同能力或背景的学生在学习上的进步程度也是不同的。一些学生在领会知识点方面就是比其他学生快,而这与老师的教学质量没有关系。假如让优质学校A的学生和各方面都稍差的学校B的学生同时开始学习相同难度的代数课,一年以后,A校学生的代数成绩更理想,原因可能是A校的教师教学能力更强,也可能是A校学生的学习能力更强,还有可能二者兼有。研究人员正在致力于开发一套针对不同能力和背景的学生的教学质量统计评价方法,在此期间,我们所有关于寻找“最佳”学校的努力都有可能适得其反,误导大众。
1702643033
1702643034
每年秋天,芝加哥的几家当地报纸和杂志都会对该区域内的高中进行一次排名,其主要参考依据通常是州考成绩。从统计学的角度看,这些排名难免会有一些让人捧腹的地方,比如常年位居榜单前几位的都是一些选择性招生的学校,意思是说学生要进入这些高中,就必须提出申请,申请者中只有很小一部分的人能够如愿,而这些学校在挑选学生时最重要的参考依据就是学生的统考成绩。我们就这个问题作个小结:(1)这些学校因其学生在州考中的出色发挥而被认为是“优质”学校;(2)要进入这些学校学习,首先学生要有非常高的考试分数。这一逻辑就好比是给一支篮球队颁奖,理由是这支篮球队的训练在促进学生长高方面贡献卓著。
1702643035
1702643036
面对你想要衡量和管理的对象,就算你找到了一个有效的评价指标,挑战也并未结束。好消息是“用统计学进行管理”能够让相关个人或组织的潜在行为往好的方向改变。如果能够计算出一条生产线上生产出的产品的不合格率,而且这些不合格产品是由组装工人自身的原因造成的,那么对那些生产出的产品不合格率低的工人给予某些奖励,能够在一定程度上激励全厂工人积极工作的态度,这就是一个统计学优化工作的例子。无论是谁,都不会对激励措施(哪怕仅仅是几句赞扬或一个地段好一点的停车位)无动于衷的。统计学帮我们得到重要的结果,激励措施给我们改善结果的理由。
1702643037
1702643038
坏消息则是,在某些时候,统计学的功能仅仅是让数据看上去更顺眼。
1702643039
[
上一页 ]
[ :1.70264299e+09 ]
[
下一页 ]