首页 理论教育 计划教学来实现由评价例证的课程目标

计划教学来实现由评价例证的课程目标

时间:2022-02-27 理论教育 版权反馈
【摘要】:显然,教学结束之后的课堂评价对于教师所教内容的影响是微乎其微的。丽贝卡确实希望她的学生能学到更多,然而在咨询了这个地区标准化测验的教师手册之后,她对于如何更有效地进行教学计划感到迷茫了。对于丽贝卡来说,在手册中,关于测验要考察语文内容部分的描述使她对教学目的的认识更加模糊。因此,如果设计评价是在教师的教学计划之前,明确的评价结果就能帮助教师作出更适当的教学决策。

现在我们来看第二种基于评价提升课堂教学质量的策略。就像之前提到的,很少有教师熟悉这一策略。它需要教师认真地重新思考教育评价的角色。

一直以来,教师在系列教学的尾声或是接近尾声时使用课堂测验,并希望学生们在这样的测验中表现出色。如果学生在教学后测中获得成功,往往意味着学生学得很好,相应的,也说明教师教得很好。现在,越来越多的课堂测验仅仅被安排在教学结束或是接近结束时(比如,接近学期或学年结束时,或是在一个短期教学单元之后)。显然,教学结束之后的课堂评价对于教师所教内容的影响是微乎其微的。教师的教学,或者至少是大部分教学,在测验时已经成为定局。

因此,课堂评价对于教学计划几乎没有什么影响。至少在20世纪70和80年代,教育问责制(Educational accountability)时代来临之前是这样。在那个时期,大多数州的立法者制定了一系列的法律,规定学生必须通过基础技能测验,才能得到高中学位或追求更高的学历。这就是被教育者称作“高风险”测验的诞生。之所以这样称呼,是因为对于被要求参加这样测验的学生来说,测验的结果是至关重要的。

对于州际测验是如何成为高风险的,还有另外一种解释。在那些所有或者几乎所有学生都通过测验的学校,教师和管理人员会被称颂。但是在那些有很多学生没有通过测验的学校,教师和管理层会受到指责。在20世纪80年代,报纸上面开始刊登州内所有地区和学校的测验成绩,于是与州际测验相联系的风险就愈加升级。每个学校和地区被拿来和其他同州学校和地区比较排名。当然就有了同样数量的赢家和输家。

就像在第1章里提到的,测验涉及的内容开始影响课堂教学的内容了。术语测量驱动教学(measurement-driven instruction)在20世纪80年代开始被广泛应用,用来描述一种教育改革策略,在这种策略中,人们希望高风险测验的内容能够对课堂教学内容有实质和正面的作用。

由于学生在重要的州际和地区考试中的表现备受关注,我们同样看到,学生在教师设计的课堂测验中的表现也逐渐受到越来越多的关注。很多教育管理人员和政策制定者下了这样的结论,如果学生在州际测验中的表现反映了学校教育的有效性,那么即使在课堂层面,测验结果也应该指明教学是否出色。人们越来越强调测验是教学有效性的证据,这种有效性体现在学生在任何形式的课堂测验中的进步。而这也逐渐成为教师个人评定的重要指标。在多数情况下,一个教师的能力是由或者至少部分是由学生在其课堂测验中的表现来判定的。

由于人们把学生的测验结果视为对教师教学有效性的判定指标,而这种观点对教师管理的影响也越来越大,这很自然就导致了许多教师总是试图把所有测验涉及的内容加入到教学中。显然,测验已经开始影响到了教学,同时教师也意识到,测验的内容也许不仅仅是可以,甚至是应该影响教学。

如果测验应该影响教学,那么为什么不在制订教学计划之前就进行课堂评价呢?这样的话,任何系列教学将会更加有效地吻合测验内容。并且,为什么不在设计评价时有计划地设想有关评价的教学内容呢?或者说,为什么不这样做,除了在设计教学前进行课堂评价,同时还让评价为教师的教学设计提供有益信息呢?可能你已经猜到了,这种手段其实是第二种策略,即基于评价提升教学质量策略的精髓。图12.4比较了这种由评价影响教学的模式和另一种更加传统的由教学影响评价的模式。

小湖统一校区的新学督之所以被这个地区的校董选中,是由于她承诺将会“让我们标准化测验的成绩大涨”。随后,普拉斯底·沃特斯高中英语教师丽贝卡·罗(Rebecca Rowe),被学生在校长那里告了一状。“把语文课的标准化测验分数提上去,否则您自己琢磨后果!”这是校长在走出丽贝卡教室之前吼出的最后一句话。

丽贝卡确实希望她的学生能学到更多,然而在咨询了这个地区标准化测验的教师手册之后,她对于如何更有效地进行教学计划感到迷茫了。对于丽贝卡来说,在手册中,关于测验要考察语文内容部分的描述使她对教学目的的认识更加模糊。

她的一个同事告知丽贝卡,在学校的指导员办公室,教师可以看到标准化测验的具体形式,因为每年春天都会举行测验,然后试卷会储存在每个学校里。同事认为让学生熟悉一些实际的测验项目就能有助于实现“上头要求的分数提升”。

➡ 如果您是丽贝卡,面临这样的境况,您会如何决策?

在传统的教学设计手段中,教学影响评价,而且①教师受由州和辕或地区采用的课程引导,②教师为实现课程表中阐明的目标而设计教学活动,③教师为实现课程中阐明的目标而评价学生。同样在图员圆援源,在评价影响教学的教学设计手段中,①教师从课程阐明的教学目标开始,②继而基于这些目标设计评价,③然后才会为了提升学生对于知识、技能和/或态度而设计教学活动。在两种手段中,课程表都是开端。课程目标(无论它们被标注为教学目标、内容标准、基准或是一些类似描述)仍旧支配整个过程,但是它们的教学设计和评价设计的顺序是相反的。

图12.4 传统的教学影响评价VS评价影响教学(它们都由课程目标支配)

受到评价启发的教学以这样的假设为基础:在许多情况下,评价的内容必将影响教师的教学决策。因此,如果设计评价是在教师的教学计划之前,明确的评价结果就能帮助教师作出更适当的教学决策。

当教师在作出教学计划之前设计课堂评价时,教师实际是在追求课程目标之前先明确课程目标。换句话说,评价实现了定义教学目标是否被达到的功能。这样的功能在教师进行教学计划之前为他们提供了更清晰的视角。

正如之前提到的,切记课堂评价代表了需要提升的知识或技能。教师的教育不应指向课堂测验本身,而应该指向由课堂测验所代表的知识、技能或态度。教师在制定教学决策之前进行课堂评价,将会有助于他们对教学目标有更明确的认识。当然,教师对课程目标认识越清晰,对选择适当教学手段来实现课程目标也会更富于技巧。

随着教师越来越清晰地认识到,由此衍生出来的裨益也越来越明显。以下列出了一些作为准教师的你们将会获得的最突出的裨益:

 

教学计划将会从早期的课堂评价设计中受益,其最根本的原因是,教师将会从课前评价中更好地理解当课程结束时学生应该获得什么。

既然评价工具的性质常常会影响一个教师的教学设计,那么为什么不特意构建这些评价,以更容易地作出适当的教学决策呢?如果教师希望从课堂评价中获得最大化的收益,就必须在构建评价时特别注意应该如何教会学生达到评价设计的要求。换句话说,在设计课堂评价时,教师必须时时刻刻“思考教学的可能性”。无论是选择性反应测验、建构性反应测验,还是自陈情感量表,教师必须都持续地自问,“我能否教授评价工具代表的内容?”。

与缺乏教学考虑而设计出来的评价相比,那些包含了教学考虑的、被精心设计出来的课堂评价工具对教师的教学决策更具启发性,对于教师的教学决策更有启发性。从表12.2可见,在教学设计前施行考虑到教学因素的课堂评价,将对教学设计产生实质性的帮助。

表12.2 创建课堂评价的时机与其对于教学设计的益处

或许您要嘀咕,做比说难,确实如此。接下来,在本章结束前,我们都将重点论述这一话题,即如何建立能够启发教学的评价工具。依次地,我们将考虑如何创建有益于教学的建构性反应测验(比如主观考试)、选择性反应测验(比如多项选择考试)和情感测评(比如自陈情感量表)。

建构性反应测验,就像我们在第7章中见到的那样,范围从最基本的“填空”小测验一直到十分复杂的表现性测验,在后者中,学生需要对于具有智力要求的任务展开详尽的书面和/或口头回答。简而言之,在每个建构性反应测验中,都有一个任务要学生完成,以及一个评分表来判定学生表现。

学生任务越是精细,相应的评分表也要求越精细,反之亦然。比如,在测验中,学生只需要填写特定历史事件发生的时间(一项绝对零碎的活儿),就完全不需要一项比判断“学生是否填对了日期”更精细的评分手段。

然而,对于更苛刻的任务,评定学生的回答通常是基于一个评定细则。就像第8章中见到过的,评价细则有三个本质特征:①明确学生对于任务回答的评判标准;②描述对于每个标准,如何判定学生表现的质量差异;③指出评价标准是应该按整体评分还是分项评分使用。

无论一个评定细则是应该按整体评分还是分项评分使用,这些标准都是评定细则最重要的部分──至少从教学视角上看是这样。基本上,评定细则中的评价标准明确了用来区分学生间回答质量差异的因素。具有教学上考虑的评价标准会引导教师的教学计划,从而更有可能设计适当的教学。缺乏教学方面考虑的评价标准就不这么容易促进有效的教学。让我们花些时间探索评定细则的评价标准是如何帮助或损害教师的教学决策的。

回想图12.2,它显示了课堂评价应该代表学生对课程目标的掌握。(如果您没有敏锐的视觉记忆力,那么允许您翻回到图12.2偷看一眼。)现实中,几乎所有重要的建构性反应测验都更专注于对学生技能而非知识的测量(知识通常通过选择性反应测验得到更有效的评价)。因此,一项表现性测验常常倾向于提供给教师一个有效的,关于学生在表现性测验抽样考察中技能的掌握程度,基于评定细则的推断结果。如果学生在表现性测验中失败,教师可以用评定细则进行诊断观察,来发现学生在哪个环节出了问题。

与必须用评定细则对学生的表现进行评估的建构性反应评价相反,选择性反应测验为学生提供了可选择的选项。就像第6章中讲到的,教师最经常使用的选择性反应测验的类型是多项选择测验和二项选择测验。如果选择性反应测验要被用作一个由评价影响教学设计的策略中的一部分,那么这些测验同样必须在教学计划之前完成,而且设计它们时也要进行教学方面的考虑。

我们基本上可以区别出可以用选择性反应测验进行评价的两种教育目标。首先,选择性反应测验可以评价学生的知识──学生对于已记忆信息,例如事实或是重要事件发生日期的回忆。已记忆信息是布卢姆对于教育目标的认知分类中的最低层次,其教育目标认知分类的更高层次是学生获得一项技能──它与大部分建构性反应、表现性测验测量的学生技能并没有根本的区别。让我们简单看看当教师试图提升学生的知识或技能时,如何创建选择性反应测验来启发教学计划。

 

通过选择性反应测验评价知识

 

知识是个好东西。我们想让学生知道很多内容。但是如果教师仅仅是把知识填充进学生的大脑,这当然是不可接受的。我们希望学生不仅仅拥有知识,还希望他们能够掌握高层次的认知技能。由于选择性反应测验对测量学生知识十分有效,因此它常常仅被用于这个目的。如何构建关于知识的选择性反应评价,使得它具有教学启发性?答案是很明显的。为使选择性反应评价具有教学启发性,在创建测验之前,测验抽样调查的知识领域必须完全明晰。

让我们举一个简单的例子。琼斯(Jones)太太是一名小学教师,她试图提升学生对课本中新单词的记忆能力,那么在创建对于学生拼写能力的选择性反应测验时,她就必须列出符合条件的所有单词。总的单词表上可能有500个,而选择性反应测验也许只包含20到25个单词样本,但是琼斯太太需要在她的教学计划之前明确学生要学习的知识的完整领域。(在这里指的是500个符合条件的单词拼写。)

这一道理同样适用于其他任何需要记忆的知识。无论是一些历史事件的日期,单词表中词汇的定义,还是一项复杂游戏的规则,当教师在教学之前创建选择性反应测验时,他们需要阐明评价知识领域中的全部内容。从而就可以用知识领域中抽样的方法轻易地创建出评价(代表性地,如果可能的话)。在教学之前明确知识领域的轮廓无疑会使教师更精确地计划教学,使得整个知识领域中的内容都能得到注意,而非仅仅是评价中涉及的内容。

假设玛丽·鲁思·格林(Mary Ruth Green)是您最好的学生之一,她带来了一份家长留言信,其中表达了这样的担心:您的课程组织似乎是“为了测验而非教育学生。”格林先生和格林太太请您拨打他们的宅电,这样他们可以一起就这个问题与您讨论。

➡ 如果我是您,我会这样与玛丽·格林的父母进行电话讨论:

谢谢你们提出这个问题。这个考虑很重要,而且因为我们都想为玛丽·格林做最好的考虑,我很高兴能有机会向你们解释我们在课堂上是如何使用测验的。

事实上,我的教学确实受到测验的影响。但是测验仅仅代表了我试图让玛丽·格林和她的同学掌握的知识和技能。我利用测验帮助我计划教学,还有了解学生是否掌握测验代表的内容。这样,我就能知道对于某个主题是否需要更多的教学讲解。

请你们相信,我并不是仅为了某些测验项目而进行教学。事实上,我测验中的所有项目,学生之前都没有见到过。但是这些项目确实反映了学生应当提升的知识和技能。

你们也会意识到玛丽·格林的成绩一半是由档案袋评价(portfolio assessment)系统决定的,我认为,当档案袋功课样本与测验结果融合时,会让我更加清楚地掌握学生的学习进展。

➡ 现在,您将如何回答格林先生和太太呢?

通过选择性反应测验评价技能

 

就像之前指出的,当学生被要求展示更高层次的认知行为时,用来区分正确与不正确回答的标准是可能被识别出来的。比如,有教师要建立测验来测量学生对于合理的报纸广告和那些采取一个或多个广告手法的辨别能力。为了创建这样的测验,教师需要列出所有的广告手法,然后要确定测验项目,这样做的目的是为学生们提供一个给定的广告是合理还是包含了不道德的广告手法的判断机会。对于教师来说,为这样的选择性反应测验创建项目有很多好的方法。但是让我们这样设想,教师创建了一个包含10个测验项目,每个项目提供一个真实的广告和五个选项的考试。比如,一个真实广告后面可能跟随了五个这样选项:

 

上述广告(选择最佳答案):

a.使用了充斥感情的语言

b.包含了人身攻击

c.包含欺骗性的统计结果

d.援引未知权威

e.不包含以上任何缺点

 

注意要正确回答这样的问题,学生需要识别所有的不道德广告手法,原因是,对于任何给定项目,其提供的广告可能是不合理的,但是它可能不包含选项中的手法(对于每个项目,给出选项中的广告手法可能会变化)。但是,由于教师在创建测验之前列出了所有不道德的广告手法,不仅设计测验项目更加容易,教师的教学计划也容易得到完善。

对于需要学生应用技能的选择性反应评价,教师的首要任务是分离出构成这些技能的关键因素(正如我们看到的,关注技能的评定细则应具备明确的评价标准)。然后再系统地在让学生作答的每个测验项目中的选项里表达这些因素(正式地包含或者排除)。

教师在项目产生之前需要确认所有必需的知识或技能(为了学生掌握一个课程目标),一般这将通过某种任务分析实现,然后这些知识或技能将被用于创建评价的选择性反应测验选项。继而,直接指向提升这些技能或知识的教学计划才能更加有效,因为这些知识或技能可以在教学中直接得以体现。

 

情感评价(Affective assessment)

 

最后,教师如何在制订教学计划时让课堂情感评价更加有益?个人认为,致力于正式的情感评价,对学生进行正式的情感评价之于教学的最主要益处是使得教师给予情感教育更多的关注。

为说明这点,让我们以一位三年级教师霍温斯(Hovens)先生的行为为例,他决定提升学生运用数学能力的信心。假设霍温斯先生设计了一份包含十个项目的匿名自陈量表(self-report inventories),让学生在学年开始和结束时完成。十个项目中的每一项询问学生是否同意类似这样的陈述:“在商店里,我一般都能够弄清楚某项未标价格的商品卖多少钱。”学生回答的形式是,在从“非常自信”到“根本不自信”的选项中划圈。现在,霍温斯先生将会在前测和后测的基础上应用情感自陈量表,这将帮助他更加理性地认识情感变量,并且相对于情感灌注,这也必定会让他更加关注意味深长的教学环节。

此外,就像我们之前考虑过的其他种类的评价一样,在教学计划之前建立情感评价基本上可以引领教师做出更加无懈可击的教学设计。在情感领域澄清教师要提升的是什么,有助于教师更好地理解评价的情感变量的本质,从而为进一步完善教学计划作出贡献。

在过去的很多年中,越来越多的教育者为将三个字母的介词替换成两个字母的介词带来的潜在教学好处感到激动。我知道很难想象任何种类的介词变化能带来哪怕是一丁点的令人激动的因素,但是请相信我,事实确是如此。

我指的是这样的介词变化,用这样的表达——为(for)学习而进行评价,代替传统的思考评价的方式──对(of)学习进行评价。众所周知,多数教育者对评价进行了多年的思考,但他们仅仅把评价看作是发现学生学习方式的途径。显然,这种由来已久,根深蒂固的考虑测验的方式实际表达的是对学习进行评价。但是,渐渐地,我们发现杰出的教育专家们开始讨论,如果教师们想要在课堂测验的道路上走得更远,那么对待课堂测验的方式就应该是将它看作提升教学效果的载体,或者用一个简单的介词替换,即为学习而进行评价。

顺带说一句,为学习而进行评价并不能替代所有的对学习进行的评价。在教育中有很多这样的例子,我们确实希望发现孩子们知道什么、不知道什么。这就是对学习进行评价,它不是什么坏事。然而,在教学情境中居主导地位的应该是为学习而进行评价。

值得欣慰的是,越来越多的实践经验表明,当课堂评价被按照在本章前面部分阐述的方式使用时──作为提升学生学习成就的催化剂──那么学生在外部测验中的分数也将得到显著提升。两个英国的研究人员(Black and Wiliam,1998),利用对之前研究结论的全面分析,发现那些接受了为学习而进行评价的学生用6到7个月就能掌握那些接受对学习而进行的评价学生1年才能掌握的内容。但是在阐明在教师的教学中如何为学习而进行评价之前,让我先明确这个动人的说法是从哪来的。

在美国,“为学习而进行评价”这种表达常常被错误地归于理查德·斯苯金斯(Richard Stiggins,2002)、保罗·布莱克(Paul Black)、迪伦·威廉姆(Dylan Wiliam,1998)名下,尽管上述3个人总是否认他们最先提出这个表达。因为迪伦·威廉是我的一个很有能力的同事和很好的朋友,并且与很多人认为的形成这个表达的英格兰评价改革小组有联系,我问他是否可以探寻为学习而进行评价这个表达的由来(毕竟舍洛克·霍姆斯(Sherlock Holmes)也是英国人嘛)。他同意了,下面这段内容就是他的成果。

“为学习进行评价”最早出现在玛丽·詹姆斯发表于在新奥尔良举行的关于督导与课程发展联合会议上的论文(James,1992)。3年后,这个表达被用于英格兰的鲁思·萨顿的同名著作(Sutton,1995)。然而,最早对为学习进行评价和对学习进行评价作清晰对比的是吉普斯与斯托巴特,其著作第三版(Gipps and Stobart,1997)第一章的题目是“对学习进行评价”,而书的第二章的标题是“为学习进行评价”。两年之后,英格兰评价改革小组在给决策者的指导手册(Broadfoot et al.,1999)中,将介词使用的显著差别进一步介绍给了更广泛的受众。

因此,感谢迪伦像霍姆斯一样有毅力的探寻,我们现在知道了这种表达的由来。显然,它的大部分原始想法,如果不是全部的话,是从英国来到美国的。因此,我们要感谢来自英国的物品,除了茶、烤饼、甲壳虫乐队,还有在评价领域内同样值得我们感激的东西。

现在我们已经知道了为学习而进行评价的起源,接下来本章将探讨教师如何实现为学习而进行评价。首先,教师应该试着结合本章推荐的两种基于评价的策略:①按照评价结果作出教学决策,②为实现测验代表的课程目标而计划教学。但是,在这两种整体策略之外,为学习而进行评价这一原则的支持者们强调,教学和评价之间的界限应该越模糊越好。学生做的或者不做的每一件事,潜在地可以作为判断他们理解水平的信息来源。那些希望把为学习而进行评价用于他们教学的教师,必须专注且冷静地对待合理的消息来源,继而将教学决策的基础建立在学生当前的理解水平上。

莱希和她的同事(Leahy et al.,2005)提出,那些为学习而进行评价的教师最大限度地采用以下这些丰富的教学策略,似乎最容易成功:

 

 

显然,为学习而进行评价为教师们提供了一种对待教育测验的新方式。测验,在为学习而进行评价中,成为教师和学生们的帮手。我要说的是,这绝对是一种不寻常的看待教育测验的方式。

我将简单地讲一讲一个当前教师应该理解的、微妙但是可能是很重要的概念──如何最好地定义形成性评价(Formative assessment)。早在本书的第1章和本章的前几段,我就提到了保罗·布莱克和迪伦·威廉先驱们的观点,即专注于提升教学的课堂评价常常能够使得学生在外部考试(比如标准化考责制考试)中获得高分。因为这一关键发现也被很多其他的研究人员证实过,于是当前在教育领域存在这样的共识,形成性评价可以促进学生在总结性评价(summative assessments)中的表现(如联邦的NCLB测验)。

因此,现在我们常常发现出版商们在叫卖各种评价产品,而它们都打着“形成性评价”的标签。美国的顶级评价专家之一,洛林·谢泼德(Lorrie Shepard),特别苦恼于测验销售商为了市场目的而把本来可以很有用处的测验概念误用,她称之为测验销售商的腐化堕落。正如她指出的:

 

基于研究的形成性评价概念,深深植根于课堂教学过程,但它已经被测验出版商颠覆(或者说劫掠)而把它作为正式测验系统,名为基准或临时评价系统。

 

那么,到底是什么造就了形成性评价而非总结性评价呢?不幸的是,有不少的教育者到处使用“形成性评价”这种表达,就好像所有人都能很好地理解一样。然而,就像您从谢泼德的评论中看到的那样,很多商业的测验设计机构将这个标签随便贴在评价相关的产品上,这样它们就可能卖得更好。越来越多的教师和管理人员已经有了这样的概念,形成性评价的使用可以帮助提高学生在总结性测验中的分数。有了这样的信念,再加上已经几乎无所不在的对于教师提高学生分数的压力,您就会明白,在绝望中有多少教育者会抓住这根能够提高分数的形成性评价的救命稻草。这就不难理解,为什么商业测验组织在销售任何带有形成性评价标签的商品时都会获得如此的成功。现在,您经常会遇到标有“临时”评价或“基准”评价的商品,但是它们真的符合形成性评价的标准吗?有的是,有的则不然。

那么,到底什么才是“形成性评价”呢?下面的定义是由一些顶级的评价专家经过反复斟酌提炼出来的。它很好地捕捉了形成性评价的特质,而且与布莱克和威廉(Black and Wiliam,1998)在他们著名的关于课堂评价的评论中提出的概念融合得极佳:

 

形成性评价是指,在评价发生的教学环节中,信息被用来调节教学,目的是提升被测学生的学习水平。

 

一个评价要具有形成性,必须提供信息,使得在评价发生的教学环节中,教师可以对教学作出调节。假设您正在教授一个为期3周的教学单元,目的是让学生获得一项关键的科学技能,那么形成性评价的结果就要及时反馈给您,使您能够对教学单元作出调节,而且有充足的时间让这种调节发挥积极作用。形成性评价必须带来实质的调节──无论是在教学方面还是学生的学习方式上。

形成性评价不应该局限于笔头测验或者机考测验。教师可以采取非正式的手段,比如提问或者课堂讨论,可以更好地确定学生在当前追求的课程目标中的学习进展。但是必须要做到的是,形成性评价“对于调节的暗示”要尽可能地清晰。换句话说,如果您要为学生设计一个简要的小测验,并且想利用测验结果调节您的教学(如果从测验结果来看确实需要调节的话),那么您必须精心设计测验中的项目,使得学生的回答不仅仅表明“他们不会”。真正好的形成性评价必须清晰指明下一步应该做什么。显然,创建一个好的形成性评价可不是简单的事情!

有两种可以从形成性评价得来的调节方式。首先,教师可以在教学中进行调节──比如在这样的情况下,教师从形成性评价的结果中发现,学生对教师认为他们已经掌握的次级技能,其实还需要强化。于是,教师可以回到针对这种次级技能的教学并且作出调整。第二种形成性评价的影响是,它可以帮助学生针对教师提出的课程目标调节自身的学习策略。

许多人写论文来研究这样的主题:课堂评价促使教师将他们的学生转变为学习过程中积极的参与者,而不仅仅作为知识的容器,而是自发的学习合作者。确实如此,布莱克和威廉(Black and Wiliam,1998)曾经详尽阐述过学生参与课堂评价的意义,他们是从合作学习的精神而非竞争的角度出发,并且主张在可能的限度之内应该尽可能由学生自主实现。但是,即使是自主学习者仍需要知道他们自己做得怎么样,而这就是形成性评价发挥作用的时候了。

假设我在全美国抽出100个富有经验的教师,来考察他们对形成性评价这一概念的理解程度,如果其中有50个能说清形成性评价的本质,我会非常惊讶。不过,因为我现在有被惊讶的心情,不妨假设100个教师中的50个能把形成性评价的概念描述得和本书基本一致。我愿意押上“之前拥有的”许多课程计划来和您打赌,这50个见识很广的教师对于形成性评价的认识仅仅是从教师的角度出发。换句话说,这50位经得住考验的教师会认为课堂形成性评价的角色仅是为教师提供证据,使得他们能够在教学上作出调节,继而更好地指导孩子们。然而,这种大众化的对于形成性评价的看法还没有真正切中实质,它只对了一半。这是因为,大概有一半的课堂形成性评价的好处可以、而且应该来源于让学生积极参与到正式和非正式的教学评价中。这些评价的一个持续作用是帮助学生对自己的学习策略作出更合理的决策。如果一个形成性评价提供了必要的证据,说明某项技能没有被掌握,那么学生就不能轻易放松,说出“我已经掌握了这项技能”。

如果说形成性评价在课堂上的一个显著角色是帮助学生更有效和高效地学习,那么教师就真的需要重新思考在大多数课堂上将其仅仅作为学生评分的工具的合理性。尽管在美国的课堂上,当前存在着由来已久的传统,即用测验甄别评价学生,但试图用测验帮助学生指导他们的学习,与此同时利用测验结果为学生打分或确定排名仍然是不对的。当然,教师必须打出分数。而测验──有些测验──也确实最有可能承担决定分数的角色。但是课堂测验的绝大部分,即那些用来帮助学生更好地管理学习的测验,应该是不计分的。为了区别“专注于学习”的测验和“专注于评分”的测验,所有的教师需要事先通知学生,比如对学生讲“由于我需要给你们打分,下周三的课堂测验将不像平时我们进行的那些,而是会用作打分目的”。要紧的是不要无谓地把分数附加于学生在评价中的表现上,而损害了形成性评价给学生学习带来的好处。

让课堂评价成为教学过程的重要组成部分不是短时间内就能成功的。它将花费教师,尤其是学生很长时间来接受这样的观念,即大部分课堂测验具有提升学生学习而非鉴定甄别的功能。教师显然需要让学生事先知道哪些测验是用来评分的,但是这样的测验数量应该非常少。如果我们想从课堂测验中获益最多的话,那么就应该立即开始使用这种方法,教师应该告诉学生,“我们的课堂上有了一种新的测验活动,而且它的功能仅仅是帮助你们更好地学习要学的东西!”我敢说如果不计分的形成性评价成为了课堂活动长期的组成部分,并且推进这样的形成性评价是为了帮助孩子们学习,那么课堂将会被一种焕然一新的气氛占据。学生便可以抛弃尴尬,敢于承认他们不懂什么。这是因为教师作出了清晰的承诺,帮助学生学习需要的东西,而这种为了更好地学习的活动的核心就是形成性评价。在经常进行形成性测验的课堂上,会出现新的气象,这种气象是值得珍视的。(注意本书里“气象”这个词用得多漂亮。显然这里的概念是高度凝练的!)

我在这儿想表达的主要意思是十分简明的:教师决不能仅凭封面判断书籍内容,不能仅凭微笑判断学生兴趣,也不能仅凭名目判断评价手段。众多所谓的形成性评价的测验可能有很多弊端。形成性评价,就像总结性评价一样,质量可能参差不齐。比如,如果形成性评价真的很好,那么它的结果应该被及时用到教学中,使得教学得到所需的完善,以更好地教授被测者需要学习的内容。而且,一个好的形成性评价,应该为教学提供比总结性评价所能提供的更好的教学证据。一个好的形成性评价能够允许学生在很长一段时间内提升表现,特别是当学生能获得帮助来内化那些评价他们当前和未来表现的标准的时候。

总而言之,当授课教师创建正式或者非正式的形成性评价过程的时候,他们必须要使这些评价过程尽可能有效。一个好的形成性评价,将会令人高兴地成为这样一种测量工具,即毫无疑问的、为学习而进行的评价。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈