1704821547
美国的大学也开始渐渐理解这件事情,超过150所在不同专业名列前茅的大学已经不再强调从美国学术能力评估测验以及其他类似考试中获取的信息,美国大学入学考试(American College Testing),为美国本科的入学条件之一。与此同时,美国学术能力评估测验的创始者大学委员会也认识到了改革的迫切需求,并且已经宣布,该测试全面修改后的版本将于2016年发布。
1704821548
1704821549
既然标准化考试的反对之声这么强烈,为什么学生依然要参加那么多考试呢?为了理解这一点,我们先来讨论一下所谓的“应试产业”。
1704821550
1704821552
高风险与高底线
1704821553
1704821554
考试和教育的相关支持产业正在蓬勃发展。2013年,这个产业仅在美国的总收入就达到了165亿美元。这是什么概念呢?2013年,美国国内的电影总票房收入不超过110亿美元,同年美国的汽车销售额不超过140亿美元,而美国国家橄榄球联赛目前的商业价值是90亿美元。
1704821555
1704821556
美国应试产业由4大巨头统治,分别是培生公司(Pearson)、麦格劳-希尔教育测评中心(CTB McGraw-Hill)、河岸出版公司(Riverside Publishing)和美国教育考试服务中心(Education Testing Services,即中国学生熟知的ETS)。我在写这段文字的时候,培生公司已经在为美国的18个州提供测验材料,是美国标准化考试中的“得分王”;麦格劳-希尔教育测评中心也跟几个州签订了合同,为他们提供特拉诺瓦-加利福尼亚成就测验;河岸公司为其他州提供衣阿华基本技能测验;而美国研究生入学考试就是美国教育考试服务中心提供的服务之一。
1704821557
1704821558
这几家公司这几年都遇上了一些小问题。2013年,麦格劳-希尔教育测评中心在给纽约一些高中毕业生评分时遇到了严重的问题,导致这些学生没能准时拿到学位证书。美国教育考试服务中心也暂停了他们在英国的移民语言测试,据说是因为所谓的“系统性舞弊”问题。
1704821559
1704821560
还有“菠萝门”事件。有几年时间里,培生公司在一些州的考试中收录了一篇题为《菠萝与野兔》的文章,讲述了一只魔法兔和一颗会说话的菠萝赛跑的故事,最终以菠萝的悲惨结局收尾。学生要根据这篇不知所云的文章回答一些选择题,而选项跟这篇文章的内容一样令人困惑。听说了这篇文章的家长对此感到十分失望,甚至有人创建了一个Facebook主页,叫作“这篇文章的寓意是:菠萝没有袖子”,用以影射故事中菠萝的穿着。
1704821561
1704821562
“为什么要在州标准化考试的阅读文章中设置这么荒谬的问题呢?它既不能作为现场测试的问题,也不能用于其他目的,”一位纽约的作家家长利奥尼·海姆森(Leonie Haimson)这么问道,“尤其这些考试还具有高风险的特点,纽约市教育部门会根据这场考试的结果来决定哪个学生需要留级,在进度报告中确定学校的等级,并且在不远的将来,它还会被纳入到新的州教师评估系统里面。一个不知所云的故事,和一些显然没有正确答案的题目,在为期3天的语文考试(English Language Art)的第一天就打击了学生的自信心,这难道就是他们的目的吗?”
1704821563
1704821564
不管这样或那样的考试设计的目的是什么,对于这个产业来说,毋庸置疑的一个功能就是盈利,而且越多越好。而考试规模也是教育商业化产业链上的另一个例子。
1704821565
1704821567
商业逻辑下的标准化考试
1704821568
1704821569
标准化考试的推动很大程度上受到了国际竞争的影响,正是经济合作与发展组织发布的国际学生评估项目排名表引起了这场国际间的竞争。2012年,上海学生在阅读、数学和科学素养上都排名第一,在阅读和数学上排进前五名的都是亚洲国家或经济体,科学素养的前四名也是一样,第五名是芬兰,美国、英国、法国等国家都排在了中间。美国近期在这个排行榜上的表现,直接导致了联邦政府推动基础课程州立标准的执行。
1704821570
1704821571
经济合作与发展组织的本意是好的,没有人会反对。但问题不是出在它的本意上,而是出在它的影响上。我们经常会听到政客们,特别是西方政客批评他们国家的学生在阅读、数学和科学素养上的世界排名,并利用这些排名为学校制定更加严苛的标准,规定学校系统应该强调什么,如何去强调。
1704821572
1704821573
但有趣的是,一些在国际学生评估项目排名表上名列前茅的学校系统的标准化考试次数反而比美国要少。比如在新加坡,学生在12岁的时候需要参加一次小学毕业考试,这个考试有一定的风险,它会决定学生将进哪一所初中。而大专学院的录取则根据学生在新加坡剑桥O水准或者N水准考试中的表现来决定。与此同时,芬兰仅有一次标准化考试,那就是国家大学入学考试,学生需要在高中毕业时参加。
1704821574
1704821575
在国际学生评估项目排名靠前的学校系统中,一个值得注意的例外是上海。上海学生参加的标准化考试一直没有改变过。但正如我们已经看到的那样,上海正在考虑不再参加国际学生评估项目排名。越南也正在尝试采取不同的评估形式和教学质量考核制度,以挣脱标准化考试对小学生的紧紧束缚,而更加倚重教师们本身的判断。
1704821576
1704821577
国际学生评估项目自身也认识到关于考试的会谈需要更加谨慎,毕竟教育是要与学生以后的生活密切关联的。
1704821578
1704821579
安德烈亚斯·施莱克尔(Andreas Schleicher)是经济合作与发展组织教育技能部主任,兼秘书处教育政策特别顾问。“世界经济体不再为你知道的东西买单,谷歌知道所有事情,”他对我说,“现在值钱的是你能利用你知道的东西去做一些事情。如果想要评估一个人是否能够从科学的角度去思考一件事情,或者能否将现实世界的问题转化成数学问题,你很难找到工具去评估,但是这些在当今的世界非常重要。我们可以看到,对于常规认知技能的需求正在快速减少。那些很容易测量也很容易教的技能知识恰恰是很容易通过数字化、自动化的外包途径获取的。”
1704821580
1704821581
施莱克尔承认,通过选择题的形式去衡量知识获取存在着固有的缺陷。为了改善评估体系,美国所面临的一个挑战是考试的规模。“我们尝试着减少考试的次数和人数,以提升评估质量。参加考试的学生人数必须合理,这样我们才有可能加入开放性问题,并引入由计算机设计和呈现的评估工具。”
1704821582
1704821583
我们常常想要平衡考试内容的重要性和考试的可行性。2000年刚开始的时候,我们设立的考试科目是阅读、数学和科学3门。2003年,我们开始加入社会和情感类的部分。2012年我们又增加了一个很有意思的创造性问题解决技巧的评估。有人问,为什么我们没有从一开始就这么做,因为那个时候我们没有现在这种基于计算机呈现的评估系统。
1704821584
1704821585
如果你发给学生一张印有问题的试卷,并要求他们根据题目作答,你很难去评估学生的创新能力。创造性的问题解决技巧需要在人与问题相互作用的过程中激发出来,而在这一过程中,问题的性质也一直在变化。这只能在基于计算机的环境中实现。
1704821586
1704821587
在坚定地致力于推动国际学生评估项目等测验的同时,施莱克尔注意到,这种做法也导致了很多灰色地带的诞生。“开放式题目的信度比较低。你需要更多的题目,需要人工评分,并且是多个评分者。你还会遇到评分者信度的问题。人们不喜欢这样做,因为这更加昂贵,也会有更多争议性。但是作为补偿,你能得到更多相关信息。人们回答开放性问题时的陈述与回答多选题时提供的信息会很不一样。”
1704821588
1704821589
但世事往往如此,问题的症结不是出在信息的收集上,而是出在了测试的用途上。2014年5月,来自世界各地的大量学者合作发表了一封针对安德烈亚斯·施莱克尔的公开信,要求国际学生评估项目在处理其他事情的同时,考虑提供一个排名表的替代品,并且跳出考试给学生时间去吸收他们已经学到的东西。
1704821590
1704821591
“政府、教育部部长和报纸的编辑部都在焦急地等待国际学生评估项目的结果,无数政策报告也将国际学生评估项目的结果作为权威引用,”公开信写道,“它们正在对很多国家的教育实践产生深远的影响。参与国际学生评估项目的一个结果就是,多个国家都在对教育系统进行彻底‘检修’,希望能提高他们的排名。国际学生评估项目成绩的止步不前使很多国家陷入了‘国际学生评估项目恐慌’,他们纷纷宣称,当前的教育系统正在面临危机。群众也呼吁相关官员下台,要求教育部门根据国际学生评估项目的规则进行长远改革。”
1704821592
1704821593
在这封信里,联名者们最担心的一点就是,国际学生评估项目的结果会导致国家标准化考试增多。国家可能会为了提高排名而对教育系统做一些短期内有效的调整,却不能真正改善学生处境。
1704821594
1704821595
评估在教育中是基础性的。我没有质疑我们对评估的需求,而是在质疑当前的评估形式和它们所造成的伤害。那么什么是评估?评估的目的又是什么呢?
1704821596
[
上一页 ]
[ :1.704821547e+09 ]
[
下一页 ]