打字猴:1.704821557e+09
1704821557
1704821558 这几家公司这几年都遇上了一些小问题。2013年,麦格劳-希尔教育测评中心在给纽约一些高中毕业生评分时遇到了严重的问题,导致这些学生没能准时拿到学位证书。美国教育考试服务中心也暂停了他们在英国的移民语言测试,据说是因为所谓的“系统性舞弊”问题。
1704821559
1704821560 还有“菠萝门”事件。有几年时间里,培生公司在一些州的考试中收录了一篇题为《菠萝与野兔》的文章,讲述了一只魔法兔和一颗会说话的菠萝赛跑的故事,最终以菠萝的悲惨结局收尾。学生要根据这篇不知所云的文章回答一些选择题,而选项跟这篇文章的内容一样令人困惑。听说了这篇文章的家长对此感到十分失望,甚至有人创建了一个Facebook主页,叫作“这篇文章的寓意是:菠萝没有袖子”,用以影射故事中菠萝的穿着。
1704821561
1704821562 “为什么要在州标准化考试的阅读文章中设置这么荒谬的问题呢?它既不能作为现场测试的问题,也不能用于其他目的,”一位纽约的作家家长利奥尼·海姆森(Leonie Haimson)这么问道,“尤其这些考试还具有高风险的特点,纽约市教育部门会根据这场考试的结果来决定哪个学生需要留级,在进度报告中确定学校的等级,并且在不远的将来,它还会被纳入到新的州教师评估系统里面。一个不知所云的故事,和一些显然没有正确答案的题目,在为期3天的语文考试(English Language Art)的第一天就打击了学生的自信心,这难道就是他们的目的吗?”
1704821563
1704821564 不管这样或那样的考试设计的目的是什么,对于这个产业来说,毋庸置疑的一个功能就是盈利,而且越多越好。而考试规模也是教育商业化产业链上的另一个例子。
1704821565
1704821566 让学校重生 [:1704819796]
1704821567 商业逻辑下的标准化考试
1704821568
1704821569 标准化考试的推动很大程度上受到了国际竞争的影响,正是经济合作与发展组织发布的国际学生评估项目排名表引起了这场国际间的竞争。2012年,上海学生在阅读、数学和科学素养上都排名第一,在阅读和数学上排进前五名的都是亚洲国家或经济体,科学素养的前四名也是一样,第五名是芬兰,美国、英国、法国等国家都排在了中间。美国近期在这个排行榜上的表现,直接导致了联邦政府推动基础课程州立标准的执行。
1704821570
1704821571 经济合作与发展组织的本意是好的,没有人会反对。但问题不是出在它的本意上,而是出在它的影响上。我们经常会听到政客们,特别是西方政客批评他们国家的学生在阅读、数学和科学素养上的世界排名,并利用这些排名为学校制定更加严苛的标准,规定学校系统应该强调什么,如何去强调。
1704821572
1704821573 但有趣的是,一些在国际学生评估项目排名表上名列前茅的学校系统的标准化考试次数反而比美国要少。比如在新加坡,学生在12岁的时候需要参加一次小学毕业考试,这个考试有一定的风险,它会决定学生将进哪一所初中。而大专学院的录取则根据学生在新加坡剑桥O水准或者N水准考试中的表现来决定。与此同时,芬兰仅有一次标准化考试,那就是国家大学入学考试,学生需要在高中毕业时参加。
1704821574
1704821575 在国际学生评估项目排名靠前的学校系统中,一个值得注意的例外是上海。上海学生参加的标准化考试一直没有改变过。但正如我们已经看到的那样,上海正在考虑不再参加国际学生评估项目排名。越南也正在尝试采取不同的评估形式和教学质量考核制度,以挣脱标准化考试对小学生的紧紧束缚,而更加倚重教师们本身的判断。
1704821576
1704821577 国际学生评估项目自身也认识到关于考试的会谈需要更加谨慎,毕竟教育是要与学生以后的生活密切关联的。
1704821578
1704821579 安德烈亚斯·施莱克尔(Andreas Schleicher)是经济合作与发展组织教育技能部主任,兼秘书处教育政策特别顾问。“世界经济体不再为你知道的东西买单,谷歌知道所有事情,”他对我说,“现在值钱的是你能利用你知道的东西去做一些事情。如果想要评估一个人是否能够从科学的角度去思考一件事情,或者能否将现实世界的问题转化成数学问题,你很难找到工具去评估,但是这些在当今的世界非常重要。我们可以看到,对于常规认知技能的需求正在快速减少。那些很容易测量也很容易教的技能知识恰恰是很容易通过数字化、自动化的外包途径获取的。”
1704821580
1704821581 施莱克尔承认,通过选择题的形式去衡量知识获取存在着固有的缺陷。为了改善评估体系,美国所面临的一个挑战是考试的规模。“我们尝试着减少考试的次数和人数,以提升评估质量。参加考试的学生人数必须合理,这样我们才有可能加入开放性问题,并引入由计算机设计和呈现的评估工具。”
1704821582
1704821583 我们常常想要平衡考试内容的重要性和考试的可行性。2000年刚开始的时候,我们设立的考试科目是阅读、数学和科学3门。2003年,我们开始加入社会和情感类的部分。2012年我们又增加了一个很有意思的创造性问题解决技巧的评估。有人问,为什么我们没有从一开始就这么做,因为那个时候我们没有现在这种基于计算机呈现的评估系统。
1704821584
1704821585 如果你发给学生一张印有问题的试卷,并要求他们根据题目作答,你很难去评估学生的创新能力。创造性的问题解决技巧需要在人与问题相互作用的过程中激发出来,而在这一过程中,问题的性质也一直在变化。这只能在基于计算机的环境中实现。
1704821586
1704821587 在坚定地致力于推动国际学生评估项目等测验的同时,施莱克尔注意到,这种做法也导致了很多灰色地带的诞生。“开放式题目的信度比较低。你需要更多的题目,需要人工评分,并且是多个评分者。你还会遇到评分者信度的问题。人们不喜欢这样做,因为这更加昂贵,也会有更多争议性。但是作为补偿,你能得到更多相关信息。人们回答开放性问题时的陈述与回答多选题时提供的信息会很不一样。”
1704821588
1704821589 但世事往往如此,问题的症结不是出在信息的收集上,而是出在了测试的用途上。2014年5月,来自世界各地的大量学者合作发表了一封针对安德烈亚斯·施莱克尔的公开信,要求国际学生评估项目在处理其他事情的同时,考虑提供一个排名表的替代品,并且跳出考试给学生时间去吸收他们已经学到的东西。
1704821590
1704821591 “政府、教育部部长和报纸的编辑部都在焦急地等待国际学生评估项目的结果,无数政策报告也将国际学生评估项目的结果作为权威引用,”公开信写道,“它们正在对很多国家的教育实践产生深远的影响。参与国际学生评估项目的一个结果就是,多个国家都在对教育系统进行彻底‘检修’,希望能提高他们的排名。国际学生评估项目成绩的止步不前使很多国家陷入了‘国际学生评估项目恐慌’,他们纷纷宣称,当前的教育系统正在面临危机。群众也呼吁相关官员下台,要求教育部门根据国际学生评估项目的规则进行长远改革。”
1704821592
1704821593 在这封信里,联名者们最担心的一点就是,国际学生评估项目的结果会导致国家标准化考试增多。国家可能会为了提高排名而对教育系统做一些短期内有效的调整,却不能真正改善学生处境。
1704821594
1704821595 评估在教育中是基础性的。我没有质疑我们对评估的需求,而是在质疑当前的评估形式和它们所造成的伤害。那么什么是评估?评估的目的又是什么呢?
1704821596
1704821597 让学校重生 [:1704819797]
1704821598 神奇的“学习记录法”
1704821599
1704821600 评估就是对学生的成就和进步做出判断。正如我在《让思维自由》一书中提到的那样,评估有两个组成部分:描述和比较。如果你说有人可以在4分钟内跑1.6公里,或者有人会说法语,这就是在对他们能做什么进行一个中立的描述。如果你说一个人是这个地区最棒的运动员,或者这个人说的法语像当地人一样流利,这些就是评估。两者的区别在于,评估会把个人的表现与其他人作比较,并根据特定的标准给他们评定等级。
1704821601
1704821602 评估有几个基本功能。首先是诊断功能,可以帮助教师理解学生的掌握程度和现阶段的发展水平;其次是塑造功能,收集学生的学习和活动信息来帮助他们进步;最后一个功能是总结,是在一个工作项目结束的时候对总体表现做一个评价。
1704821603
1704821604 有的评估系统使用字母和分数进行等级评定,这样做的一个问题在于,它们会轻描述而重评价。学生有时得到某个分数,却不了解它意味着什么;教师们有时给出一个分数,却并不确定原因。另一个问题是,总结的过程应该是很复杂的,仅仅一个数字或者一个字母没有办法传递这些庞杂的信息。甚至对于有些结果,用这种方式根本没有办法充分表达。正如埃利奥特·艾斯纳(Eliott Eisner)曾经评价的那样:“并不是所有重要的东西都是可以衡量的,也不是所有可以衡量的东西都是重要的。”
1704821605
1704821606 提高评估价值的一个方式就是把“描述”和“比较”这两个元素分开。我们可以去评估学生各种形式的表现:出勤率、学习档案、论文写作,以及利用其他媒体平台完成的作业等。学习档案可以利用一些实际例子和来自学生自己及他人的反思性评价,对学生的学习完成情况进行一个详细的描述。
[ 上一页 ]  [ :1.704821557e+09 ]  [ 下一页 ]