首页 理论教育 学习评价的方法

学习评价的方法

时间:2022-03-04 理论教育 版权反馈
【摘要】:在我国,长期以来饱受批评的教学问题之一就是“应试教学”。“应试教学”导致学生死记硬背,教师往往缺乏灵活的教学方法,学生则学习视野狭窄,学习兴趣低下,容易引发紧张的师生关系和学生关系,成为教学改革的对象。在美国,21世纪初随着问责制的贯彻,学生的成绩成为考核教师的主要指标,从而引发新一轮的应试教学浪潮。

二、学习评价的方法

学习评价的不同方法可以服务于某一类型的评价,某一评价的方法也可以服务于不同类型的评价。学习评价常见的方法有测验、观察和访谈,有表扬、批评等奖惩的方法,有提问、作业和游戏等评价方法,还有表现性评价。这里简要说明两种,其余的评价方法见以后各节或第七章。

1.测验

测验是检验教学质量最为常用和传统的评价方法,主要有以下一些类型。

(1)测验的类型

①纸笔测验(paper and pencil test)。它是以书面形式进行的测验,它有客观性测验(objective test)和主观性测验(subjective test)之分。客观性测验是指学生在题目中选择或填写正确答案的测验,可以细分为判断或是非题、填空题、匹配题和选择题。这类题目或提供正确和错误的答案,要求学生通过思考判断,选择出正确的答案;或不提供任何答案,要求学生凭借记忆把正确答案填写出来。主观性测验是指学生可以自由回答的测验,主要是简答题和论述题。前者回答有一定限制,不用充分展开,而后者可以充分地、创造性地表述自己对问题的看法,可以检测学生的各种学习能力,如记忆能力、组织材料的能力、分析综合能力、逻辑思维能力、文字表达能力以及对题目的解释能力等。

②口头测验(oral test)。它常用于检测那些不能用书面测验检测的技能。它以口头表达技能为测试中心,同时以听懂或看懂为表达的前提。测验项目涉及语言结构、词汇、语音、语调、流畅性等,口头角色扮演,据图描述等,但口试的客观性程度存在一定差异。

③操作测验(operational test)。它是非文字测验,要求学生对出示的图画或数字做出行为反应。在韦氏成人量表中就包括如下操作测验:数字符号、画图补缺、积木图案、图片排列、物体拼配。至于学科教学中技能性内容,更离不开操作测验,例如体育课中各项运动技能技巧,物理、化学、生物的各种实验技能。操作测验适用于仪器操纵、身体动作和手的技巧方面。

④标准化测验(standardized test)。它是编制、实施、评分、记分以及分数解释各个环节一致的测验。在形式上,它是由各类客观式题目组成的;在内容上,它区别于教师自编测验。标准化测验的特点是,题目取样范围大,不受各种教学材料和大纲的限制,反映出测验所要求的检测水平。

(2)测验题的编制

判断题就是给学生提供两个答案,要求他们在“是—非”、“正—误”之间做出选择。编写题目时措辞要严密,不能让学生一眼就看出正确的选项;题目少用否定句,避免造成困扰;题目里不能同时出现两个概念,这会让学生无法做出选择;选项的正误或是非选择比例保持平衡;选项的长短相近。

选择题就是给学生提供若干个答案,要求他们从中选出一个或多个正确的答案。编写的题干可以是一个完整的问句或一个有空缺的陈述句,配合题干编写的选项包括正确和不正确的答案,不正确的答案称为干扰项。编写时题干的内容尽可能地充实,使学生容易明白题目在问什么;题干一般都用肯定的表述方式;如果用否定的形式,一般要对“不”字做特殊处理,变黑体、加粗或斜体,起到提醒的作用;选项的长短不能有明显的不同,以免出现暗示的效果,正确答案的位置都要做随机的处理,避免出现猜测的可能;在多项选择中,不可出现“以上都是正确的”选项,而用“以上都是错误的”选项会增加学生选择的难度。

匹配题就是要求学生从反应项里选出与前提项一致的答案。编写时,各系列条目都要保持同一的性质;条目都比较简短;反应项的数量一般要超过前提项;说明反应项使用的次数,通常可以选择使用的次数为一次;排列时注意各反应项的逻辑顺序;排版时尽可能地把反应项与前提项放在同一页内,便于学生阅读。

填空题就是要求学生在一个不完整的题目里正确地写出空缺的内容,形成正确的意思。编写时题目一般采取直白的陈述,使学生容易理解;回答时要简洁,不需要写长句;空格一般在句子中间或偏后;空格的数量一般在一和两个之间;空格的长度相等,避免学生的猜测。

主观题型的简答题和论述题的区别主要在学生回答的自由度上。前者要求学生回答的内容和形式是有限制的,通常是以说明、解释或分析等单一的陈述方式表达出来,也较简短;后者要求学生综合运用不同的陈述方式全面表述自己的观点、态度或意见,回答篇幅较长。编写的题目应该使学生比较容易理解;写出题目应得的分数,供学生答题时参考;说明答题的时间;题目不提供学生的选择数量或范围,一律全做。

(3)测验的优势与不足

各类测验题都有自身的优势与不足,这里做一整体的说明。客观题的优势是适合检测学生的事实性知识的掌握程度,题目覆盖面大,学生能较快地完成每一题,评分标准统一,能够弥补主观题型的缺陷。不足的地方在于编题需要花费较多的时间,题目难以检测学生的语言表达能力、组织能力、创造能力,学生凭借记忆回答的习惯可能助长记忆零碎知识的倾向,助长学生的猜题现象。

主观题的优势是适合检测学生的高水平认知能力,如批判思维、观点的综合;题目的编写花费较少的时间,也减少了学生的猜题可能,但是不足在于题目覆盖面小,不能代表教学材料内容的全部,检测质量可能会出现因学生掌握程度不同而导致偏差的情况;评分标准难以统一,评分易受评题者的主观因素影响而有失公正。

热点聚焦4-1   为测验而教

在我国,长期以来饱受批评的教学问题之一就是“应试教学”。“应试教学”导致学生死记硬背,教师往往缺乏灵活的教学方法,学生则学习视野狭窄,学习兴趣低下,容易引发紧张的师生关系和学生关系,成为教学改革的对象。在西方,为考试而教的情况也一直受到批评。在美国,21世纪初随着问责制的贯彻,学生的成绩成为考核教师的主要指标,从而引发新一轮的应试教学浪潮。批评者,如哈佛大学的瓦格纳教授认为这样的教学搞坏了教学,只教给学生答案,教师只是大量地传授内容,学生不会思考,虽然考试成绩在进步,但学生走出校园后知识无法学以致用。他提出学生在校园必须掌握的七项技能:问题解决与批判思维能力,通过网络合作与通过影响力领导,灵活性与应变力,首创精神与创业能力,有效的书面与口头沟通能力,信息的获取与分析,好奇心与想象力。

在现行的教育制度下,为测验而教是无法避免的现实情况。虽然有这样那样的缺点,但赞成者的理由也不少。它明确了评价的领域和范围,促使教师重视教学内容的重点和难点,这种外部的压力能够激发教师的动力,要为学生测验所涉及的知识、技能等内容设计好的教学方案来实现教学目标。更重要的是为那些贫穷的学生创造了升入高一级学校的基本条件。

(4)测验的运用

教师可以根据教学大纲和教学材料内容的实际进程,应用测验来检查学生的掌握情况。不同题型组成的测验可以同时使用,以达到全面检测学生学习的目的。这里我们简要地从试卷的准备、测验的实施和评分等三个环节做一说明。

试卷的准备涉及试题的编排、指导语和试题的编辑。试题的编排要根据题型分成几个先后不同的部分,例如判断题、匹配题、填空题、选择题、简答题和论述题,一般来说,它们构成了试卷的基本格局,教师可以把重要教学材料内容编写进去。指导语针对每一题型扼要地说明答题的目的和时间要求;答题的方法也要做交代,鼓励学生猜测自己不懂的题目。试题的编辑要考虑试卷的空间布局,阅读和答题的便捷性,编号等细节方面。

测验的实施需要给学生提供良好的环境,消除学生的考试焦虑;引导学生进入考试,避免任何意外的干扰分散学生的注意力。不能有任何暗示、预防或防止作弊的情况出现。尽量排除无关因素的干扰,保证测验分数的可靠。

评分的环节要在批阅完试卷后计算出答题的总分。答案统一、明确,评分准确、客观。要从测验的评分判断学生对教学材料的掌握程度;学生不必借助教师也可以自己评卷,及时反馈学习效果。

学术研究4-1   增值评价

传统测验主要通过学生的考试分数来评价学生的学习水平,也用于检验学校和教师的教学质量。但是,影响学习成绩的因素是多方面的,目前得到认同的有学生/个人及家庭背景变量,例如性别、年龄、是否转学、特殊教育需求、父母文化程度、家庭经济条件等;学校背景变量,例如生源特点(贫困学生的比例,低学业成就学生比例等)、办学条件、教育投入、学校管理等。这些因素是测验无法衡量和考虑的,因此田纳西州立大学的威廉·桑德斯教授在20世纪80年代后期研究并提出增值评价,试图加以克服。

增值评价要求通过具有较高信度和效度的测验,收集每年全校所有年级、所有学生的相关测验分数;要求每次成绩测验的题目必须是新的且没有冗余,而且,每次测验题目必须具有同等的难度和良好的区分度,即区分高学业成绩学生与低学业成绩学生。

增值评价就是以学生的测验分数为基础,比较数据库里几年的测验结果,用来预测未来学生的学习进步分数,于是每位学生之前的学业进步情况就成为其未来成长的比较标准。新的考试成绩同学生前几年的测验分数综合起来,在班级、学校和学区范围内进行分析。教师任教班级学生的平均进步分数,和学校、学区、全州及全国平均进步分数的比较,可以判断教师的绩效。

2.表现性评价

表现性评价(performance assessment)是通过学生完成某一特定任务来判断学生的学习状态。它的根本目的是检查学生运用知识的能力,即把知识转化为实际行动的能力。可以说,表现性评价强调的不是学生知道什么,而是学生能做什么。例如,一个教授演唱的教师关注的是学生是否能把曲子唱准,唱好,唱出感情,而不是关注学生知道多少关于演唱技巧的知识。

表现性评价强调学习活动的价值是在现实情境下的真实表现,也可以是运用知识解决有意义的现实问题。增加表现或任务的真实性是这一评价的必然要求,不过真实性的程度是不同的。例如学生的口语交流可以是与外国人直接对话,也可以是和自己的同学进行会话练习。

表现性评价旨在解决传统的测验方法解决不了的问题,例如学生的批判性思维能力和科学研究的能力。它既重视过程,也看重结果,例如学生收集资料、观察,提出假设,得出正确的结论的过程,以及学生写出研究报告的结果。它没有唯一的正确答案,过程的科学性和观点的合理性才是它所看重的。它可以广泛运用于这些领域:交流,例如演讲、辩论;操作,例如实验、解剖;运动,例如游泳、打球;社会交往,例如小组合作、游戏;概念获得的展示,例如电路的设计、实验数据的总结。针对上述不同领域的运用,表现性评价常常需要确定学生表现的评价标准,由评价者用来进行观察、评判。

概括起来,它具有如下的特点。第一,要求呈现有意义的真实性任务,这些任务是作为实地现场的表现而设计的;第二,强调高水平的思维和更复杂的学习;第三,有清楚明了的评价标准,因此学生都知道他们将被怎样评价;第四,要求尽可能地为具体对象展示学生的工作;第五,不仅评价学习的结果,还要评价学习的过程。

(1)表现性的任务

它可以分为限制性的表现性任务和扩展性的表现性任务。前者在预期的表现上更明确,结构性更强,完成的时间较短。例如,为两个城市制作反映一个月平均降雨量的图表。扩展性的表现性任务要求学生在任务所提供的信息基础上,从不同的渠道去查找信息。例如准备一个演讲,劝说人们采取行动保护环境

选择表现性任务需要考虑如下情况:关注那些需要复杂认知技能和学生表现的学习结果;选择和开发在内容和技能上能代表重要学习结果的任务;确保评价任务与评价项目的高度相关;为学生提供必要的指导,让学生能够理解任务的要求;设计使学生能够更好地理解任务的指导语;运用评分规则使学生清楚地了解完成任务的预期目标。(Linn Robert L.& Gronlund Norman E.,2003)

(2)表现性评价的优势与不足

表现性评价的优势主要体现在以下几个方面。第一,可以在课堂内外的实际生活环境中进行,评价的进行就是考察在自然的生活情境下特有学习活动的表现是否与教学目标符合。第二,实现纸笔测验无法完成的复杂学习的结果,正如前面说过的,能够真正考察出哪些知识得到什么程度的实际转化。第三,它也可以考察学习的过程,如实验技巧、运动技能的操作步骤。

表现性评价的不足主要是不同教师可能遵循的评价标准不一致,以及在不同时间、场合下进行的评价也可能导致不同的结果。此外,表现性评价需要大量的时间,不仅要给学生充裕的时间完成表现性任务,而且不同阶段的组织和安排也需要足够的时间保证。需要设计良好的教学活动来搭建这样的展示平台,即使耗费大量的时间也是值得尝试的。

(3)表现性评价的运用

它的运用需要制定出合适的评分细则,其中常用的是核查表,这是用来对学习情况作简单判断的一种记录工具,适用于简单的学习任务,更多地依赖观察来确定学习的结果。教师或学生都可以使用核查表,如果他们共同使用的话,既可以比较和沟通,又可以提高学生的自评能力。下面是一堂“观察植物细胞”的生物实验课,看看核查表是如何运用的。(刘艳红,2007)

上课时教师请学生拿出各自准备的材料,学生纷纷出示,有花生、树叶、苹果、香蕉、青菜叶等。教师提问,这些材料能在显微镜下直接观察细胞吗?同学们可以试一试。试过后,有的学生说可以,有的说不行。教师就请能够直接观察到细胞的同学与其他同学分享,等互相观察结束后,教师再进行详细的讲解。

接下来,教师要求学生阅读书上相关内容,然后制作和观察临时装片。几分钟后,教师请几位已经做过临时装片的学生起来讲一讲他们制作装片的感受。有的说:不难,不过撕表皮时不能撕错,要撕内表皮而不是外表皮;有的说:不难,不过表皮一定要展平,否则细胞叠在一起看不清楚;也有的说:难,盖玻片时会产生许多气泡。结合学生的发言,教师重点讲解了制作洋葱鳞片叶表皮细胞临时装片时特别需要注意的问题,并下发“行为核检表”,请学生边做边对照边自我检查。

img32

教师巡视每个同学的操作,几分钟后有学生陆续举手示意已经完成,教师走过去鉴定,选择完成得最好的装片,提醒学生项目评价中的问题,然后请全班学生一起观察、点评。

实践探索4-1   档案袋评价

在国外的教学实践中,档案袋评价已经成为许多学校教学活动的一个部分,是深入了解学生的重要工具。最近,国内也有学校开始尝试使用。它由四个问题组成:建立档案袋的目的,谁来进行评价,什么样类型的作品放入档案袋,以什么标准来评价作品。

档案袋评价的目的有四点:显示学业的成就,记录学习的进步,体现学生的兴趣和才能,证明课程的效果。前三点主要针对学生的,最后一点是考核教师的。与目的相一致的评价内容是学生的成绩水平,学习进步的程度,兴趣和才能的深度和广度,实现课程标准的程度。

评价的主体涉及教师、同事、专业评价者和课程负责人,还有参与的学生,究竟是谁来评价主要取决于谁做评价能取得应有的效果。评价的范围主要是选取有代表性的学生作品,涉及学生学习的各类课程,尤其在艺术、语言和阅读课程中受到普遍欢迎,成为反映一个人真实水平的证明材料。学生的作品包括规定的或自主完成的日常作业、实验报告、研究报告、手工制作、作文等;作品可以是纸质的,也可以是录音带、照片和光盘等。例如学习语文的学生,他的作文一般能代表他的语言发展水平。收集作品的工作可以由学生个人或学习小组承担,也可以由师生共同承担,伴随平时的教学同步进行。

究竟应该有多少代表作品才能保证分析的效果,应该取决于评价的具体目的。首先,从数量上来说,选的太少不可能做出有效的评价,选的太多则可能迷失。其次,代表作品是学生发展的真实写照,从能力、态度、技巧、表达等各方面记录学生的实际情况。例如,通过对学生作品的观点分析,教师可以了解学生获得概念的过程,目的在于修正错误观点,并要求学生发展和论证他们自己的观点。

作品收集和评价都要依据统一的标准。以小学数学的标准为例,它包括(1)操作技能,可以用绘图或照片;(2)技术的运用,以口头或书面的形式报告计算机使用的结果;(3)小组合作的解决问题,以教师观察、学生互动的记录以及学生个体的陈述来表现;(4)知识的实践,以口头或书面的形式报告课堂外应用数学的实例;(5)跨学科的应用,在其他学科里应用数学图表的例子。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈