打字猴:1.70264304e+09
1702643040 如果某个高中是根据其毕业生占所在学区毕业学生总数的比例来评估校领导的能力,甚至是奖金分配方案,那么这些领导们的工作重心肯定会放在提高学生的毕业人数方面。当然,他们或许也会抽出一点精力放在提升本校学生的毕业率,但归根结底毕业人数和毕业率并不是一回事。例如,还没毕业就离校的学生可以被归类为“转校”而不是“缀学”。这不是一个虚构的例子,美国教育部前部长罗德·佩奇就是因为这个问题而备受指责。美国前总统小布什之所以提名佩奇掌管美国教育部,就是因为他成功地降低了休斯敦地区的学生缀学率、提高了学生的考试分数。
1702643041
1702643042 如果你一直默默地记下我引用的为数不多的商业警句,那么请在笔记本上写下这么一句话:“当《60分钟》电视新闻杂志栏目剧组敲你家门的时候,肯定没有什么好事。”之前丹·拉瑟和《60分钟》栏目组专门去了一趟休斯敦,发现教育部对统计数据的操纵远远超过了教育水平的提升。将缀学的学生归类为转学、出国或攻读一般同等学力(GED)文凭,在当地高中是一个极为普遍的现象,在官方的统计数据中,这些学生都不会被统计到缀学率中。休斯敦市公布的缀学率为1.5%,而《60分钟》栏目组暗访计算出的实际缀学率为25%~50%。
1702643043
1702643044 在考试分数的统计过程中,也出现了同样恶劣的作弊现象。在休斯敦(或是其他任何一个城市),提高考试成绩的方式之一就是改善教学质量,这样学生就能学到更多的知识,并且在考试中取得进步,改善教学质量确实是较好的方法。而比较差的方法则是想办法让那些成绩最差的学生“远离”考场,即使剩余参加考试的学生的成绩没有任何长进,最终考试的平均成绩也会有所提升。在得克萨斯州,10年级学生需要参加全州统考,有证据表明休斯敦的中学有意让学习能力较差的学生留级,不让他们升为10年级生。休斯敦曾曝出过一个令人震惊的事情:一个学生连续3年当9年级生,然后直接升到了11年级——通过这样一种狡猾的运作,既能让一个成绩较差的学生免于在10年级统考中使总体分数下滑,又不至于让他因辍学而影响到升学率。
1702643045
1702643046 罗德•佩奇到底有没有在他的任期内参与策划这些操纵统计数字阴谋,我们并不清楚,但有一点是肯定的,他曾颁布了一个严格的问责政策,用以奖励那些达到升学率目标和考试分数目标的学校校长,同时对那些没能达标的校长予以解聘或降职处理。可想而知,整个休斯敦的校长们必然会积极响应,在这堂“课”上他们可不愿落后。但我们必须清醒地认识到,要想在评估报告上大放异彩,这些校长必须时刻将目标放在心中,任何与其有冲突的管理方法都不会有好下场。
1702643047
1702643048 纽约州就因为类似的统计陷阱而栽了大跟头,付出了惨痛的代价。州政府之前出台了“记分卡”制度,对接受心脏搭桥手术的病人的死亡率进行统计,以便让公众在选择心脏科医生时有一个参考。这似乎是一个完全合情合理,而且有所帮助的描述统计学在政策制定过程中的应用。心脏搭桥手术是治疗心脏病最常用和有效的方法,心脏病人在搭桥手术过程中的死亡比例当然是一个非常重要的数据,而作为个人根本没有办法了解到确切数据,因此政府出面收集并向公众公开这一数据是合乎情理的。但就是这么一个“好”政策,却导致了更多病人的死亡。
1702643049
1702643050 心脏科医生肯定会在意他们的“记分卡”。但是对于一个外科医生来说,降低病人死亡率最简单的方法并不是降低病患死亡人数,因为大部分医生在救死扶伤方面已经竭尽全力了。降低死亡率最简单易行的方法是拒绝为那些病况最严重的病人动手术。罗彻斯特大学医学与牙医学院的一项调查表明,以服务病人为初衷的记分卡,到头来反而会给病人造成伤害:在参与调查的心脏科医生中,有83%的医生表示正是由于公开了死亡率数据,一些本来可以从搭桥手术中获益的病人最终没能被安排进行手术;79%的医生表示收集并公开死亡率数据或多或少地影响了他们的治疗决策。这一看似有用的描述性数据存在一个可悲的矛盾,而心脏科医生也只能理性地接受并釆取自己的对策,就是让那些最需要心脏搭桥的病人远离手术台。
1702643051
1702643052 作为一个统计指标,不仅时常会“携带”其他描述性数据可能存在的陷阱,而且就其自身而言,将许多指标数据融合为一个单一的数字,这多少都会对现实和真相产生扭曲。从定义来看,任何一个指数对其构成都是十分敏感的;无论是所采用的指标数据的变化,还是各个数据的权重变化,都会对指数的最终呈现产生影响。举例而言,为什么美国国家美式橄榄球大联盟(NFL)在计算传球效绩指数时不将第三次触地完成率考虑在内?在计算某个国家的人类发展指数时,识字率和人均收入两者的权重该如何确定?最终,我们必须面对的重要问题就是,如果计算过程的不准确性无法克服,那么花那么大气力将众多数据压缩成一个数字就只是为了简单和易于使用,这一切是否值得?有些时候,这样做的确不值得,就比如(我们之前提到的)《美国新闻与世界报道》的大学排名。
1702643053
1702643054 这份排名动用了16个统计指标为美国的学院、大学和专业院校打分、排名。以2010年为例,在为综合性大学和文理学院排名的过程中,“录取新生”占15%。基于大学录取率的“录取新生”指标,是指所录取学生中成绩占其所在高中年级前10%的学生的比例,以及录取学生的SAT和ACT(美国大学录取考试)的平均分。《美国新闻与世界报道》刊登大学排名的好处在于,这份榜单以一种简单易懂的方式囊括了全美几千所大学的海量信息,就连其批评者们也承认,其中收集的有关美国大学的很多信息都是有价值的。许多有远见的学生都会想要知道心仪大学的毕业率和班级平均规模。
1702643055
1702643056 当然,提供有意义的信息与将这些信息浓缩成一个权威排名完全是两码事。在批评家的眼里,这份排名设计粗糙、误人子弟、对高中毕业生的长远发展有百害而无一利。“问题之一就在于将教育机构以数字顺序进行排名,而原始数据本身并不支持如此精确的操作。”明尼苏达州麦卡利斯特学院前校长迈克尔•麦弗逊说。凭什么“校友捐赠”要占学校综合得分的5%?如果这项指标真的很重要,那么为什么不干脆占10%的比例?
1702643057
1702643058 按照《美国新闻与世界报道》的说法,“每一项指标都存在一个权重(表现为百分比的形式),我们会根据这些指标的重要程度来判断不同指标的权重大小。”可是,有时候判断和专断的界线就是那么模糊。在这个美国高等院校的排名系统中,权重最大的指标是“学术名誉”,该指标是基于其他院校的负责人所填写的一份“同行评估调查”以及高中升学指导员的调查统计得出的。马尔科姆·格雷德威尔向来对排名持怀疑的态度,大学排名更是他猛烈抨击的对象,特别是同行评估法,在他看来就是一个笑话。马尔科姆•格雷德威尔举了一个例子,密歇根最高法院的一位已经退休的大法官曾经向100多位律师寄发了一份问卷,让他们选出心目中最好的10所法学院。宾夕法尼亚州州立大学法学院的名字也出现这份问卷上,其最后的统计排名结果是宾夕法尼亚州州立大学法学院的教学质量居中等偏下。但问题出现了,在那个时候,宾夕法尼亚州州立大学法学院还没有成立。
1702643059
1702643060 面对《美国新闻与世界报道》收集的所有数据,我们不知道这些排名到底是想给那些即将跨入大学校门的高中毕业生们哪方面的指导。站在学生的立场,最值得关注的方面应该是学业本身:如果我申请了这所大学,我能在学业上获得怎样的帮助?橄榄球迷聚在一起时经常会抱怨传球效绩指数的构成,但却没有人否认其组成部分——完成率、码数、触地得分和截球——同样是评估一名四分卫的整体表现不可或缺的重要参考。但回到大学排名上来,情况就完全不同了。《美国新闻与世界报道》过于强调“输人”(例如,录取了哪些学生、教职员工的薪资待遇、全职教授所占的比例等),反而忽略了教学“输出”,除了仅有的两个例外——新生留级率和毕业率,但实际上就连这两个指标也不是衡量教学质量的。正如迈克尔·麦弗逊所指出的:“从这份排名中,我们无从知晓进入某所大学经过4年的学习之后,学生的能力是否提高了,他们的知识是否增长了。”
1702643061
1702643062 虽然大学排名看上去是一些无伤大雅的统计数据,但事实上,它会导致一些对学生或高等教育无益的行为。举例说明,用以计算排名的数据之一就是每个学生能够获得的资助,可这些钱花得值不值得,排名中却没有一个相应的衡量数据。那些花更少的钱却给予学生更好的教育(因此学费也会低很多)的大学,却在排名中体现不出优势。此外,高等院校都希望申请本校的学生人数越多越好,包括那些根本没有任何希望的学生,因为这可以让它们变得非常热门,有助于提升自己的排名。但提高排名无论对学校还是对学生都是一种浪费,学校方面要花大量精力来吸引学生,而大部分学生到最后发现自己做的也是无用功。
1702643063
1702643064 鉴于下一章的内容与概率有关,因此我不妨在此打一个赌:《美国新闻与世界报道》的大学排名时日不多了。巴德学院的院长利昂•波特斯坦说得很精辟:“人们喜欢看到简单的答案。什么是最好的?当然是第一名。”
1702643065
1702643066 本章内容一直在强调,统计陷阱与数学能力的关系不大。哪怕是令人叹为观止的精确计算也会混淆视听,甚至成为不良动机的掩护。有时候哪怕你准确无误地计算出平均数,也无法改变中位数在对真相的描述中更加准确这样一个事实。判断和正直成为关键所在,就好比一个人非常懂法也不能阻止其犯下罪行一样。渊博的统计学知识无法遏制不道德的行为,无论是统计学还是法律,坏人总是清楚地知道自己在做什么!
1702643067
1702643068
1702643069
1702643070
1702643071 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 [:1702642304]
1702643072 赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第4章 相关性与相关系数
1702643073
1702643074 视频网站根本不知道我是谁,但它又是怎么知道我喜欢看人物纪录片而不是电视连续剧、动作片或科幻片的?
1702643075
1702643076 有一段时间,每当我打开网飞视频的页面,总是会弹出一条收看提示,建议我观看纪录片《布托》——一部关于巴基斯坦前总理贝娜齐尔·布托的生平与悲
1702643077
1702643078 惨遭遇的“富有深度与煽动性”的电影。我对这部电影的印象不错,而且也把《布托》加入到了我的观看列表中。最神奇的是,在那些网飞推荐给我的影片中,如果是我之前看过的影片,那么毫无疑问这些影片都是我非常喜爱的。
1702643079
1702643080 网飞公司是如何做到这一点的?在其公司总部是不是有一大群实习生,整天在谷歌网站上搜索有关我的信息,并综合了我的家人和朋友的观影兴趣,得出我可能会对一位巴基斯坦前总理的纪录片感兴趣的结论?当然不可能。网飞公司只不过是掌握了一些非常复杂、精密的统计学手段。网飞公司甚至根本不知道我是谁,但却知道我过去喜欢看什么类型的电影(因为我曾经在网站上为这些电影打过分)。基于这一信息,再加上其他用户的评分以及一台强大的电脑,网飞公司对于我的电影品位的预测精准得令人震惊。
1702643081
1702643082 我将会告诉大家网飞公司做出这些预测的具体算法,现在最重要的一点是:这所有的一切都基于相关性。网飞向我推荐的电影与我喜欢的其他影片类似,此外,该网站还向我推荐得到某些网友高度评价的影片,而这些网友的打分恰恰与我的打分非常接近,可以说这些网友是一群与我“臭味相投”的观影者。纪录片《布托》之所以会出现在我的网页上,是因为我给另外两部纪录片打了满分五颗星,这两部影片分别是《屋内聪明人》和《战争之雾》。
1702643083
1702643084 相关性体现的是两个现象之间相互关联的程度例如在夏天,温度的高低与冰淇淋的销量就存在相关性,当温度升高时,冰淇淋的销量也会相应提高。如果其中一个变量的改变引发另一个变量朝着相同的方向变化,那么我们说这两个变量存在正相关性,就比如身高与体重之间的关系,(一般来说)个子高的人体重会重些,个子矮的人体重会轻些。如果一个变量的改变引发另一个变量朝着相反的方向变化,那么这两个变量就存在负相关性,比如锻炼与体重。
1702643085
1702643086 凡事都没有那么简单,有些时候也会出现与上述相关性相违背的现象。有些个子矮的人就是比个子高的人重一些,有些从来不运动的人甚至比运动爱好者苗条,但无论怎样,身高与体重、锻炼与体重之间总是存在着有意义的关联。
1702643087
1702643088 如果对美国成年人的身高、体重进行随机取样,我们会得到如下一幅散点分布图:
1702643089
[ 上一页 ]  [ :1.70264304e+09 ]  [ 下一页 ]