首页 理论教育 基于评价的学生等级评定

基于评价的学生等级评定

时间:2022-02-27 理论教育 版权反馈
【摘要】:正如我们所了解的,在对学生进行等级评定时,教师除了要考虑他们在课堂评价中的表现如何之外,还需要考虑很多其他的因素。他已经拥有了6年的教龄,在过去的一年里,克雷默对曾经便用过的等级评定方法进行了批判性思考。事实上,如果克雷默仅仅依靠努力程度对学生进行等级评定,那么这3名学生一定可以名列前茅。然而,随着学生年级的升高,教师应该选择有代表性的学业成绩作为评定等级的标准。

一个基本的事实是:教师需要对学生进行等级评定。有人认为,教师在制订教学方案的时候,其中必须包括关于等级评定的内容。除了考虑到传统的原因之外,还有哪些原因促使教师不得不经常性地开展这项工作呢?

这个问题的答案其实一点儿也不复杂,概括而言主要包括以下两个方面:①教师在每个学年的不同阶段中对学生进行等级评定,这有助于学生对某些知识要点的掌握程度进行及时地自我了解和自我判断;②教师在整个学年结束时再对学生评定等级,这会帮助学生从整体上检验和衡量自己掌握知识的情况。这犹如教师给学生制作了很多种套餐,他们不仅想知道学生对每一餐的喜好程度,而且想知道学生对全部套餐的整体感受。当然,相当重要的一点是,如果教师想要了解自己教得如何,他们就应该精确地知道学生学习的范围是什么;同理,如果学生想要了解自己学得如何,他们也必须明确自己应该掌握的内容有哪些。还记得吗,我们曾经在本章的前面强调过这一点。

正如我们所了解的,在对学生进行等级评定时,教师除了要考虑他们在课堂评价中的表现如何之外,还需要考虑很多其他的因素。当然不容置疑的是,给学生划分等级最主要的依据是学生在评价中的表现。在本章最后一部分,我们将简要介绍把评价结果纳入学生等级的不同方法。

卡尔·克雷默(Karl Kramer)是第十二街道小学一名二年级的教师。他已经拥有了6年的教龄,在过去的一年里,克雷默对曾经便用过的等级评定方法进行了批判性思考。这种思考缘于3名学生,这3名学生按计刘应该接受一种特殊教育方案的指导,但是现在却重新回归主流,进入克雷歌任教的班级。

尽管这3名学——玛丽(Marie)、弗洛伊德(Floyd)和詹姆斯(James)——理解课堂内容都或多或少地存在这样那样的困难,但是他们学习非常努力。事实上,如果克雷默仅仅依靠努力程度对学生进行等级评定,那么这3名学生一定可以名列前茅。

克雷默在过去对学生评定等级的时候从没有把努力程度作为一个因素,但是现在,他开始认真考虑这个间题了。

➡ 如果您是克雷默老师,您会怎么办呢?

不幸的是,教师们往往很少认真思考如何评定等级,除非他们被迫面对这个问题。(作为中学里的一名新教师,我认为在给学生评定等级之前,我需要30秒钟的时间考虑学生等级评定的方法。)比较合理的等级评定方法是:在等级评定之前就已经审慎地考虑过评定需要的标准,并对每个标准赋予相应的比重。

您所使用的等级评定标准可能是在充分考虑学生评价表现的基础之上制订的——当然就是指不同类型的测验题。而标准的比重则要依据其重要程度来决定,例如:期末考试的结果往往就比期中考试的结果所占的比重要大,以此类推,期中考试的结果常常又比每周测试的结果所占的比重要大。如果在课堂评价中,教师使用的是档案袋评价方法,那么他就可以根据档案袋中不同比重的内容来衡量学生的能力了。同理,如果学生被要求来完成一套相当精细的表现性评价任务,那么教师肯定会认为,评价结果中该测验所占的比重比其他要求低、难度小的测验任务要大。简而言之,制订比重也是有章可循的,即不同类型评价的重要程度。和不少教师一样,如果您也有一本专门的成绩记录簿(纸质的或是电子的),上面仔细记录了学生每次测验的表现,那么您一定会强调不同测验所占的不同比重。

固然评价结果很重要,但在等级评定时,教师还应该参照其他一些标准,例如,有的教师在等级评定的过程中还会把课堂参与表现、家庭作业完成情况以及课堂学习中与其他同学的合作程度等作为标准。我在这儿仅仅想告诉您,在您对学生进行等级评定之前,应该认真考虑以下两个问题:①明确您在等级评定时所要考查的要素;②确定这些要素所占的比重。

当然,与初中或高中的教师相比,小学教师往往很少考虑评定等级时应当注意的事项。比如,一年级的教师可能认为在他们班级里最主要的教育目标就是培养学生的自我控制能力,帮助他们逐渐适应社会性情境。例如,一个7岁大的男孩或女孩在课间休息时出现了攻击班级其他男孩或女孩的行为,那么,这个7岁大的男孩或女孩就产生了不良行为。

然而,随着学生年级的升高,教师应该选择有代表性的学业成绩作为评定等级的标准。当然,低年级的任课教师也不例外,他们同样需要设计一套合理的标准,并对标准的比重予以明确。他们评定等级时所使用的方法与高年级是相同的,但是划分等级的标准却与高年级不同。教师先要确定标准,然后对其进行描述,最后赋予它们在学生等级评定中所占的比重。

当教师对学生进行等级评定时,有几种可供选择的方法。对于学期末考试或者学年末考试来说,教师有必要遵守所在学区的基本规定。因此如果一个学区的分级方法使用的是A,B,C,D,F五个等级,教师即使在整个学年中都没有使用这种方法,那么在期末或是期中考试时他也必须用字母对学生进行等级评定。尽管个别学区或者学校对分级方法的规定相当笼统,但是很多学区的分级方法还是相当具体的,甚至规定了某一等级学生人数的比例。

一般来说,当教师对一个学生的表现进行描述的时候,主要使用三种方法:①字母等级;②数字等级;③语言描述。我们绝大多数人都很熟悉字母等级,因为这种等级评定的方法已经被广泛使用很长时间了。A等级表示优秀,F等级则表示不及格,一些地区还允许教师在字母后面使用“+”或“-”,这样,一个五点量表(A、B、C、D、F)就变成了15点量表,我们认为等级F-表示最糟糕。数字等级体系中的满分通常是一个确定数字,比如100,50或10,学生们的每个课堂评价都会得到一个分数值,这样,当学生们看到他们评价的数值时就会知道他们的成绩。例如“10分的题得了7分”。当教师专门依靠如“优秀”、“满意”、“有待提高”的短语来描述时,语言等级描述符就取代了数字或字母等级描述符。这些短语的数量,往往会构成语言等级描述符的级数,这完全是由教师自己来决定的。如果整个学区都使用语言等级描述符来进行等级评定的话,那么对语言等级描述符的选择往往由学区的长官决定。

成就水平分类体系是一种越来越常见的语言等级描述符,它用来描述学生在全国教育进步评估(NAEP)中的表现。NAEP每隔几年在全国范围内进行一次施测(某一学科的两次NAEP间通常有几年的时间间隔),学生的表现会被划分为高级、娴熟、及格、不及格四个等级,这种四等级的成就水平分类模式在整个美国都得到了非常广泛的应用。事实上,最近一个调查表明,在全美50个州当中,绝大多数州都使用了NAEP的这四个等级或与此相类似的等级描述符。所以,在语言等级描述符中,NAEP使用的这种分级方法是一种最主要的形式。因为NCLB法案要求每个州都要使用这些描述符号中的三个(也就是高级的、娴熟的、及格的),许多州都简单地采用了NAEP的四等级成就水平分类模式。所以很明显,使用NAEP的成就水平描述符是对语言等级描述符的进一步修改与完善。大量的学区都尝试着设计一套基于标准的报告卡片,其中包含了每个学生对每个内容标准(课程目标)的掌握程度。事实证明,在很多情况下,学生、家长以及教师对这些报告卡片所代表的详细内容并不清楚。

现在我们来共同学习三种最常见的等级评定方法,这三种方法不仅适用于学期末考试和学年末测验,而且也适用于平时的多种评价。换言之,您既可以用这三种方法为约翰尼(Johnny)同学评定其科学课的期末等级,也可以用这三种方法评定他在两星期的心理抑郁实验中的表现。

事实上,您很可能已经非常熟悉我们即将要描述的三种等级评定方法了,因为在您还是学生的时候,您和它们早就有过“亲密接触”了。

 

■ 绝对的等级评定法(Absolute grading)。如果教师对学生进行绝对的等级评定,评定依据就是教师对学生所持有的心理预期,比如教师拟定一个标准作为A级水平。因此,如果一个英语教师把“绝对的娴熟”设立为A级标准,并且假设一个班中没有一名学生的表现达到了这一水平,那么该班所有学生的等级都不能是A。相反,如果教师认为所有的学生都达到了这一绝对的评定标准,那么全班同学的等级都应该是A。绝对的等级评定方法常见于标准参照评价中。
绝对等级评定法的基本观点是:如果某一学生处于某一等级,那么该生一定要切实达到与此等级相对应的合理期望水平,而且这一期望水平是由教师决定的。通常情况下,所谓“绝对的期望”也是参照大多人的水平来制订的。所以,从这个意义上来说,这个绝对也是相对的。

■ 相对的等级评定法(Relative grading)。在教师进行相对的等级评定时,其评定依据是学生相对于其他学生的表现情况。因此在任何一个小组内,都会存在表现最好的学生和表现最差的学生。一组中表现最优的学生未必绝对水平有多高,但其等级一定会最高。相反,因为一些学生的分数总是比其他学生低,那么不管具体的分数值是多少,其等级一定会很低。这种相对的等级评定法一般应用于常模参照评价中。
正如在前面提到的,如果教师对学生的表现有绝对要求,如等级A、B、C、D或F,那么他的依据是其多年的教学经验及其对学生一般表现能力的了解。但需要注意的是,相对等级评定方法的常模群体是教师现在所教班级的全体同学,而不是这位教师曾经教过的所有学生。
相对等级评定方法最核心的观点是:由于教师的教学水平不同,班与班的整体状况也有所区别,所以应把一个班的学生作为常模群体,在这个群体中评定每个学生的等级。由于相对等级评定方法的等级期望是因班而异的,具有一定的灵活性,所以教师更喜欢使用这种评定方法。

■ 基于能力的评定法(Aptitude-based grading)。如果根据能力评定等级,教师就应该根据学生表现相对于学生能力水平的符合程度确定等级。举例而言,如果一个特别聪明的学生在课堂上的表现超过了其他所有学生,但是他的表现还是没有达到教师认为的与其能力相对应的优秀水平,那么这个学生的等级就应该是B,而不是A。当然,要想根据能力进行等级评定,教师必须了解学生真实的学习能力。为了了解学生的学习能力,教师不仅需要充分考虑学生在已有测验中的表现,而且还必须就学生潜在的学习实力作出估计。因为如今已不常使用学业能力测验了,所以教师需要通过观察来自行判断学生的学习能力。
基于能力的评定方法的主要观点是:根据学生的内在能力评定等级可以促使学生充分发挥他们的潜质。可能您已经猜到了,这种等级评定法的最大问题在于,很难确定每个学生真正拥有的学习潜能。

 

正如我们在前面所提到的,这三种等级评定方法中的任何一种都能够用来对学生的成就进行等级评判。也就是说,这三种方法既可以帮助我们衡量学生在一次小型主观题测验中的表现,也可以帮助我们评价他们在一个学年里的整体学习状况。大家不妨回想一下我们在第9章中曾经提到的档案袋评价,如果您想给学生的档案袋也划分等级的话——这个等级可以采用字母、数字或者语言描述的形式,使用上述任何一种方法都可以满足您的要求。

从数量上看,等级评定的方法不止一种,那么教师究竟选择哪种方法对学生进行等级评定呢?最近一些研究者撰文指出,大多数教师在给学生评定等级时运用了综合的等级评定法。这也就是说,教师往往是在综合了学生各方面的表现之后才会作出最终的判断,他们通常会从以下几方面来衡量学生:①评价成就;②努力程度;③态度;④课堂行为表现;⑤进步情况。

使用综合等级评定法的教师通常希望学生在这五个方面都能够有出色的表现,而且希望自己能够从这五个方面入手为那些成绩不够理想的学生寻找到问题产生的症结。然而实际情况是,很多教师完全凭借主观判断来对学生的成绩、努力、态度、表现、进步进行简单合成。迄今为止,综合的等级评定法没有建构起一套符合科学规律的量化方法,因而其说服力和可信度有限。这种等级评定的方法总是让人觉得像一盘大杂烩或是一个大拼盘。

在最近一项对300多名教师和7000多名学生进行的调查中发现,大多数教师都报告说,他们最常用的等级评定方法就是综合的等级评定法(Cross and Frary,1999)。学生们的说法也验证了这一点,他们认为大多数教师的确使用的是综合评定法。而且,调查还显示:大部分学生们都很认可教师采用的这种评定方法。在评定等级时,虽然教师可能只是主观地综合了成绩因素与各种非成绩因素,但是学生好像甘愿冒这个风险。或者更确切地说,与仅仅把评价成绩作为评定依据相比,学生们更希望教师能同时考虑其他方面的多重因素。

尽管许多经验丰富的教师倾向于通过传统的方式来保存学生的成就记录,即将分数登载到纸质的计分簿上,但是如果教师能够使用计算机来完成这项工作,那就会更加迅捷和高效。随着教师队伍的年轻化,教师们对电脑的驾驭表现得越来越娴熟,因此,我们也高兴地看到学生记录中电脑计分正在迅速普及。

事实上,大量与计分相关的程序早就问世了,利用它们可以帮助教师更好地保存学生的成就记录,而未来的几年里一定会出现更多的此类程序。这些电子分级程序的任务就是简化教师的工作,这样一来,只要教师能够掌握如何使用计算机的基础知识,就可以节省大量的花在录入上的时间。美国的一些课堂观察家预测,在十几年左右的时间内,传统的手工成绩记录将逐渐消失。

如果教师在对学生评定等级的时候不会出现误差那该多好啊!但是,正如您在学生时代里可能偶然取得一个很高的成绩,可能偶然取得一个很低的成绩一样,教师在等级评定时无法避免误差。当然教师在对学生评定等级的时候并不希望这种误差存在,然而,等级评定要求教师作出主观判断,所以误差难以被消灭。

假如阿奎诺(Aquino)夫人是您班上玛丽(Mary)同学的母亲,她很想了解关于等级水平评定的问题,尤其是想知道玛丽“现在的等级水平”如何。

➡ 如果我是您,下面是我对阿奎诺夫人的解答:

我很高兴您想了解一下玛丽在我们班的学习情况和所处的等级,我觉得您不妨参观一下我们班的信息系统,这是今年我在笔记本电脑上使用的新型信息系统。如果方便的话,您在课前或课后都可以到班里来,我将向您展示给玛丽评定等级的全过程,我还将向您进一步解释我是如何来确定学生成绩以及其他方面的表现在等级评定中的不同比重的,这对分级具有决定性的意义。

阿奎诺夫人,您应该知道,对任何学生进行等级评定都是基于教师的综合判断,是我们在考虑了多重因素后最终决定的。坦率地讲,毕竟教师也是普通人,因此等级评定只能力求客观,但不可能做到准确无误。

不过,我在这里可以向您保证,在我们学校里我和其他教师在对学生评定等级的时候都会尽力做到公平和客观。您有空就来参观一下我们的教室吧!我会让您亲自看到玛丽的等级是如何被确定。

➡ 现在,如果是您,您将如何回答阿奎诺夫人的问题呢?

幸运的是,在长期摸索的过程中,我们发现这种误差会被其他一些因素平衡掉。您现在还记得第8章中我们所学的三种评价偏见么,即宽容偏见、严格偏见和集中趋势偏见。事实上,很多教师在对学生评定等级的时候确实存在这三种偏见。因此,有的学生可能连续几年取得很高的等级,但是事实上他并没有达到相应的要求;而另外一些学生的等级一直会毫无理由地处于低位。当然,您也不要过于苛求,在评定学生等级时,如果您已经作了最充分的准备——评定过程很认真,并且考虑了本章提到的这些问题——那么您已经尽力了。人类的判断,不可能不存在一点儿偏差。所以,学生等级评定中出现偏差也是正常的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈