1704821568
1704821569
标准化考试的推动很大程度上受到了国际竞争的影响,正是经济合作与发展组织发布的国际学生评估项目排名表引起了这场国际间的竞争。2012年,上海学生在阅读、数学和科学素养上都排名第一,在阅读和数学上排进前五名的都是亚洲国家或经济体,科学素养的前四名也是一样,第五名是芬兰,美国、英国、法国等国家都排在了中间。美国近期在这个排行榜上的表现,直接导致了联邦政府推动基础课程州立标准的执行。
1704821570
1704821571
经济合作与发展组织的本意是好的,没有人会反对。但问题不是出在它的本意上,而是出在它的影响上。我们经常会听到政客们,特别是西方政客批评他们国家的学生在阅读、数学和科学素养上的世界排名,并利用这些排名为学校制定更加严苛的标准,规定学校系统应该强调什么,如何去强调。
1704821572
1704821573
但有趣的是,一些在国际学生评估项目排名表上名列前茅的学校系统的标准化考试次数反而比美国要少。比如在新加坡,学生在12岁的时候需要参加一次小学毕业考试,这个考试有一定的风险,它会决定学生将进哪一所初中。而大专学院的录取则根据学生在新加坡剑桥O水准或者N水准考试中的表现来决定。与此同时,芬兰仅有一次标准化考试,那就是国家大学入学考试,学生需要在高中毕业时参加。
1704821574
1704821575
在国际学生评估项目排名靠前的学校系统中,一个值得注意的例外是上海。上海学生参加的标准化考试一直没有改变过。但正如我们已经看到的那样,上海正在考虑不再参加国际学生评估项目排名。越南也正在尝试采取不同的评估形式和教学质量考核制度,以挣脱标准化考试对小学生的紧紧束缚,而更加倚重教师们本身的判断。
1704821576
1704821577
国际学生评估项目自身也认识到关于考试的会谈需要更加谨慎,毕竟教育是要与学生以后的生活密切关联的。
1704821578
1704821579
安德烈亚斯·施莱克尔(Andreas Schleicher)是经济合作与发展组织教育技能部主任,兼秘书处教育政策特别顾问。“世界经济体不再为你知道的东西买单,谷歌知道所有事情,”他对我说,“现在值钱的是你能利用你知道的东西去做一些事情。如果想要评估一个人是否能够从科学的角度去思考一件事情,或者能否将现实世界的问题转化成数学问题,你很难找到工具去评估,但是这些在当今的世界非常重要。我们可以看到,对于常规认知技能的需求正在快速减少。那些很容易测量也很容易教的技能知识恰恰是很容易通过数字化、自动化的外包途径获取的。”
1704821580
1704821581
施莱克尔承认,通过选择题的形式去衡量知识获取存在着固有的缺陷。为了改善评估体系,美国所面临的一个挑战是考试的规模。“我们尝试着减少考试的次数和人数,以提升评估质量。参加考试的学生人数必须合理,这样我们才有可能加入开放性问题,并引入由计算机设计和呈现的评估工具。”
1704821582
1704821583
我们常常想要平衡考试内容的重要性和考试的可行性。2000年刚开始的时候,我们设立的考试科目是阅读、数学和科学3门。2003年,我们开始加入社会和情感类的部分。2012年我们又增加了一个很有意思的创造性问题解决技巧的评估。有人问,为什么我们没有从一开始就这么做,因为那个时候我们没有现在这种基于计算机呈现的评估系统。
1704821584
1704821585
如果你发给学生一张印有问题的试卷,并要求他们根据题目作答,你很难去评估学生的创新能力。创造性的问题解决技巧需要在人与问题相互作用的过程中激发出来,而在这一过程中,问题的性质也一直在变化。这只能在基于计算机的环境中实现。
1704821586
1704821587
在坚定地致力于推动国际学生评估项目等测验的同时,施莱克尔注意到,这种做法也导致了很多灰色地带的诞生。“开放式题目的信度比较低。你需要更多的题目,需要人工评分,并且是多个评分者。你还会遇到评分者信度的问题。人们不喜欢这样做,因为这更加昂贵,也会有更多争议性。但是作为补偿,你能得到更多相关信息。人们回答开放性问题时的陈述与回答多选题时提供的信息会很不一样。”
1704821588
1704821589
但世事往往如此,问题的症结不是出在信息的收集上,而是出在了测试的用途上。2014年5月,来自世界各地的大量学者合作发表了一封针对安德烈亚斯·施莱克尔的公开信,要求国际学生评估项目在处理其他事情的同时,考虑提供一个排名表的替代品,并且跳出考试给学生时间去吸收他们已经学到的东西。
1704821590
1704821591
“政府、教育部部长和报纸的编辑部都在焦急地等待国际学生评估项目的结果,无数政策报告也将国际学生评估项目的结果作为权威引用,”公开信写道,“它们正在对很多国家的教育实践产生深远的影响。参与国际学生评估项目的一个结果就是,多个国家都在对教育系统进行彻底‘检修’,希望能提高他们的排名。国际学生评估项目成绩的止步不前使很多国家陷入了‘国际学生评估项目恐慌’,他们纷纷宣称,当前的教育系统正在面临危机。群众也呼吁相关官员下台,要求教育部门根据国际学生评估项目的规则进行长远改革。”
1704821592
1704821593
在这封信里,联名者们最担心的一点就是,国际学生评估项目的结果会导致国家标准化考试增多。国家可能会为了提高排名而对教育系统做一些短期内有效的调整,却不能真正改善学生处境。
1704821594
1704821595
评估在教育中是基础性的。我没有质疑我们对评估的需求,而是在质疑当前的评估形式和它们所造成的伤害。那么什么是评估?评估的目的又是什么呢?
1704821596
1704821598
神奇的“学习记录法”
1704821599
1704821600
评估就是对学生的成就和进步做出判断。正如我在《让思维自由》一书中提到的那样,评估有两个组成部分:描述和比较。如果你说有人可以在4分钟内跑1.6公里,或者有人会说法语,这就是在对他们能做什么进行一个中立的描述。如果你说一个人是这个地区最棒的运动员,或者这个人说的法语像当地人一样流利,这些就是评估。两者的区别在于,评估会把个人的表现与其他人作比较,并根据特定的标准给他们评定等级。
1704821601
1704821602
评估有几个基本功能。首先是诊断功能,可以帮助教师理解学生的掌握程度和现阶段的发展水平;其次是塑造功能,收集学生的学习和活动信息来帮助他们进步;最后一个功能是总结,是在一个工作项目结束的时候对总体表现做一个评价。
1704821603
1704821604
有的评估系统使用字母和分数进行等级评定,这样做的一个问题在于,它们会轻描述而重评价。学生有时得到某个分数,却不了解它意味着什么;教师们有时给出一个分数,却并不确定原因。另一个问题是,总结的过程应该是很复杂的,仅仅一个数字或者一个字母没有办法传递这些庞杂的信息。甚至对于有些结果,用这种方式根本没有办法充分表达。正如埃利奥特·艾斯纳(Eliott Eisner)曾经评价的那样:“并不是所有重要的东西都是可以衡量的,也不是所有可以衡量的东西都是重要的。”
1704821605
1704821606
提高评估价值的一个方式就是把“描述”和“比较”这两个元素分开。我们可以去评估学生各种形式的表现:出勤率、学习档案、论文写作,以及利用其他媒体平台完成的作业等。学习档案可以利用一些实际例子和来自学生自己及他人的反思性评价,对学生的学习完成情况进行一个详细的描述。
1704821607
1704821608
在同伴评估中,学生会自己制定评价标准,并对他人的学习情况进行评价。这些方法在评估创造性工作的时候特别有效。
1704821609
1704821610
有些教师在课堂上总是有各种评估方式,但考试方式的扩张挤掉了其他途径的位置。不过,也有一些教师正在努力回归到原有的方式。这个过程充满挑战,但也带来了无穷的好处。乔·鲍尔(Joe Bower)就是其中的一个例子。乔·鲍尔是加拿大阿尔伯塔省的一名科学与艺术语言教师,在教学生涯的第6年,他决定不再使用分数作为自己的首要评估形式。“分数成了学校的首选‘药品’,而我们都像上瘾了一样……分数一开始是教师们的工具,但现在教师成了分数的工具。”
1704821611
1704821612
鲍尔发现,对分数的依赖导致他的教学效率更低,也对学生们产生了负面的影响。他指出,当很多学生被问及他们从课堂中得到了什么时,很多人会回答:“我得到了一个A。”所以当学校坚持要求鲍尔在报告卡上给学生打分时,他反而废除了在课堂上给出的所有分数,让学生们自己评估自己的表现,并让他们推荐自己该得的分数,然后再填写在报告卡上。
1704821613
1704821614
学生们的意见通常与鲍尔的意见一致,甚至有很多时候学生们会给自己偏低而不是偏高的分数。废除评分制的结果是,学生们身上的压力减轻了,他们得以将重点放在课堂作业和课后作业的内容上,而不是得到的分数上。
1704821615
1704821616
评估跟真正的学习一样复杂,当我们尽力降低这种复杂性时,掩盖的东西反而比我们揭露的要多得多。最终,等级评定制度造成了错误的评估,因为评估不应该是一张电子表格,它应该是一场“对话”。我是一个每天都积极评定学生表现的教师,但我在几年前扔掉了我的成绩簿。我们热衷于把学习和人简化成数字,但如果我们想要探寻正确的方式,让学习而不是分数成为学校的重点,我们就应该抛弃这种狂热。
1704821617
[
上一页 ]
[ :1.704821568e+09 ]
[
下一页 ]