首页 理论教育 多层的评价标准

多层的评价标准

时间:2022-02-25 理论教育 版权反馈
【摘要】:评价标准越具体明了,学生对自己的学习过程和结果就越容易做出判断。三个层面中,宏观层面的课程标准和质量监控评估项目强调结果性评价,注重甄别和选拔功能,标准相对固定;其他层面的评价则多属于过程性评价,目的是促进学习和发展,标准则更为灵活。因此,三个不同层面的评估标准可以互补,而同一层面评估中的不同角色也可以根据评估共同反思、共同努力,形成一个较为系统全面的评估标准体系。

评价标准越具体明了,学生对自己的学习过程和结果就越容易做出判断。而建构完善的写作评价体系体现出课程设计者的缜密深厚的思考。评估应该是多层次的,不同层次的评估有不同的意义。宏观来看,《课程标准》、国家教育质量监控层面的评估项目(比如高考)等毫无疑问属于这一层面;中观来看,包括教材及区域的教学基本要求对学生提出的学习要求及评估;微观来看,有教师、学生、家长在学校、课堂或家庭中实施的日常评估。三个层面中,宏观层面的课程标准和质量监控评估项目强调结果性评价,注重甄别和选拔功能,标准相对固定;其他层面的评价则多属于过程性评价,目的是促进学习和发展,标准则更为灵活。因此,三个不同层面的评估标准可以互补,而同一层面评估中的不同角色也可以根据评估共同反思、共同努力,形成一个较为系统全面的评估标准体系。而无论哪个层次的标准,无论是形成性的还是总结性的,都会对学生产生一定的影响。评估也许会改变他们的教育机会,增强或减弱他们的学习动机,使他们对自己或他人产生积极或消极的情感,影响他们对什么是会读写、受教育以及什么是成功的理解。不管来源和目的,所有的评估都应该对学生有益,而不是伤害学生。

1.宏观层面

《课程标准》与《考试评估》首尾呼应,高屋建瓴,提出高中写作评价标准。

普通高中语文课程标准》(2013版,以下简称《标准》),对高中写作提出了具体的要求,原文如下:

1.学会多角度地观察生活,丰富生活经历和情感体验,对自然、社会和人生有自己的感受和思考,多方面地积累和运用写作素材。

2.写作时考虑不同的目的和对象,以负责的态度表达自己的看法,激发表达真情实感的热忱,培植科学理性精神。

3.作文要观点明确,内容充实,感情真实健康;思路清晰连贯,能围绕中心选取材料,合理安排结构。通过写作实践发展形象思维和逻辑思维、分析和综合等基本的思维能力,发展创造性思维。

4.根据个人特长和兴趣自主写作,力求有个性、有创意地表达。在生活和学习中多想多写,做到有感而发,提倡自主拟题,多写自由作文。

5.根据表达的需要,展开丰富的联想和想象,恰当运用叙述、说明、描写、议论、抒情等表达方式。能调动自己的语言积累,推敲、锤炼语言,力求准确、鲜明、生动。

6.写作理论类文本,如评论、随感、杂文等;写作实用类文本,如提要、自荐书、考察报告、读书报告、实验报告研究报告、会议纪要、访谈录等;尝试进行诗歌、散文等文学类文本的写作。

7.养成多写多改、相互交流的习惯,对自己的文章进行审读、反思,主动吸纳、辩证分析他人的意见。乐于展示和评价各自的写作成果。45分钟能写600字左右的文章。课外练笔不少于2万字。

从上文中可以看出,《标准》从写作的态度、文体、类型、方式、方法、习惯、能力等多方面给出了规定。当然,这一规定还显得相当粗略。这一标准,是教师实施写作课程的方向目标。而与之相应的,是在课程学习结束时的甄别选拔考试,这就是高考的作文评价标准。2013年全国卷作文评价标准如表5.1所示。

表5.1 2013年普通高等学校招生全国统一考试作文等级评分标准(中华人民共和国教育部考试中心颁布)

续 表

说明:

(1)基础等级评分,“内容”以“题意”“中心”为重点,“表达”以“语言”“文体”为重点;发展等级评分,以“有文采”“有创新”为重点。

(2)发展等级评分,不求全面,可根据下列“特征”4项16点中若干突出点按等评分。

深刻:透过现象深入本质,揭示事物内在的因果关系,观点具有启发性。

丰富:材料丰富,论据充实,形象丰满,意境深远。

有文采:用词贴切,句式灵活,善于运用修辞手法,文句有表现力。

有创新:见解新颖,材料新鲜,构思新巧,推理想象有独到之处,有个性色彩。

(3)缺标题扣2分;字数不足的,每少50个字扣1分;每个错别字扣1分,重复的不计,错别字扣满5分为止。

(4)确认有抄袭的作文,“基础等级”在四等之内评分,“发展等级”不给分。

在具体操作中,各省(市)、自治区又有自己更为细致的执行标准。如:

如《作文评分执行细则(四川省执行标准)》是这样规定的:

一、作文无标题扣2分。

二、基础等级分按标准给分,即以“题意”“中心”“语言”“文体”为重点,全面衡量,准确入等。基础等级中的内容判为四等的作文,表达项、特征等级项可在三等及其以下酌情给分。

三、特征等级分是总分的组成部分,不是奖励分,应注意区分度,但不求全面,可依据等级评分标准中“深刻”“丰富”“有文采”“有创新”4项16点中若干突出点按等评分。特征等级分以“有文采”“有创意”为重点。

四、凡认为有政治观点问题的作文,可视为“立意不当”,按等级评分标准相关要求判分,并须交阅卷组或指导委员会商量判卷。

五、确认为抄袭的作文,提供核查线索,经阅卷指导委员会核实后,按标准扣分,即“基础等级分”在四等之内评分,“特征等级分”记0分。

六、作文不足800字,每少50字扣1分。扣满8分为止。若作文只有200字以内而又未完篇者,在“内容”“表达”两项中酌情给分,总分不超过10分,“特征等级分”记0分,不再减字数分。200~400字且未完篇者,扣完8分字数后,“内容”和“表达”在三等级以下考虑,“特征”在第四等考虑。特殊文体除外,但应提交小组讨论判分。

七、每一个错别字扣1分,重复不记,扣满3分为止。

八、若因“缺题目”、“不足字数”、“错别字”需减分的,就在评分栏中“缺题目”、“不足字数”、“错别字”填上应减的分数,若没有减分,在相应栏上记“0”。

九、全篇用外语写作,一律记“0”分。全篇使用不规范汉字,交阅卷指导委员处理;局部使用不规范汉字,交作文组长处理。

几点说明:

一、阅卷教师在阅卷中发现优秀作文或各种等级、各种类型的典型作文,请将该卷保密号发给组长,由组长发给指导委员会。

二、空白卷的记分空格以“0”占位。

当然,尽管有更具体的评分细则,我们依然会觉得标准模糊。全国高考的评分标准中,“发展等级”中的“深刻”、“丰富”的边界都有些模糊。什么样的文章才算“深刻”?怎见得“基础等级”中的“朴素”就不如“发展等级”中的“有文采”?不同的阅卷教师对同一篇作文的评分容许差异非常大。阅卷中允许的差值是7分。超过7分的文章才会有三批,甚至4批。我们都说作文批阅的主观性极强,不够客观,其实这与评分标准的模糊是分不开的。审视美国SAT作文的赋分标准,我们就会发现,我们还应制定更为精准的易于操作的评分标准。这些标准越细化,操作化,就越有利于指导教学。

相比之下,美国的高考评价标准等级的赋分就比较清晰,便于选拔。

美国SAT(the Scholastic Assessment Test),为美国最具权威的大学入学考试,相当于我国的高考。2005年3月登场的新SAT(NEW SAT)增加了作文考试部分。美国SAT的写作部分,实际由作文考试与客观选择题两部分组成,即由一篇25分钟的限时作文和35分钟的49道多项选择题组成。正是这两部分而非一方面,共同体现了写作考试的效度、信度及公正度。

美国大学理事会(the College Board)规定了SAT写作部分考试的内容及要求:[67]

1.SAT写作部分中的多项选择题,涵盖三种类型的内容:改善句子(25道题),发现句子的错误(18道题),改进短文(6道题)。多项选择题要测量的学生能力是:清晰有效的信息交流;通过修改与编辑改善一篇文章;发现句子层面的错误;理解语法因素和结构及其在句子中怎样彼此联结;通过句子组合、转译字词和短语进行清晰表达;提高短文中观点间的呼应连贯。

2.SAT作文内容包括四个方面:学生应呈现和支持一个有关具体问题的观点;写作时间25分钟;文饰润色要朴素;展现初稿。作文要测量的学生能力是:在材料中具体展现有关问题的观点;用推理和从阅读、研究、经验或观察中得到的事例支撑观点;遵守标准化书面英语的惯例。

同时,大学理事会还提出了写作的方法及注意事项:

3.SAT作文没有捷径。作文太长,或有五个段落,或运用文学事例,都不会得高分。而那些来自高中和大学的阅卷老师,将会给那些表述得体、恰当,推理有力,并循循善诱地使用语言以透彻地展开观点的作文给予高分。

4.注意审题。每一个作文题都包含一个有关问题的小短文,想象你正在与这个短文作者交谈,你同意他或她还是反对?你会想到其他的什么观点或事例吗?而解决这样的问题会有助于展开你的观点。

5.不能太简单。展开你的观点并不意味着罗列许多你能想到的事例,堆积多样相关的事例会让你把一个复杂的主题简单化。用一两个深刻、清晰的推理或事例而写出的作文,比那种只有三个短而简单的事例的作文更有可能得到高分。

6.不介意用第一人称“我”。展开你对有关问题的观点,不要提供一个事实性的直接的报告。你有权自由使用“我”,并提供对你来说有效的事例,甚至是你个人生活或经验的事例。当然,你得恰当地支撑你的观点,并显示你可以很好地使用语言;但请记住:作文是一个机会——一个让你表达与你的生活有关问题的思考的机会。

大学理事会还详细规划了SAT作文的赋分标准,提供了作文样本及教师赋分的缘由或评语。

SAT作文的赋分标准:

线索清晰连贯,尽管可能有些瑕疵,文章主旨清晰,表达连贯(6分);线索合理连贯,尽管可能有些影响质量的偶然性的小错或失误(5分);线索能够连贯,尽管可能有些影响质量的失误(4分);线索欠连贯,出现一个或一个以上的明显的连续性缺点,语言模糊,思维欠连贯(3分);线索几乎不连贯,出现明显的连续性错误,不清晰流畅,段落主旨不连贯,前后不一致(2分);线索不连贯,出现严重的连续性错误,文章没有内容,思维混乱(1分)。

大学理事会在其网站上列出了6个等级且已赋分的9篇作文,并附有教师评语。下面分别是赋分1分的及6分的作文等级样本及教师评语(话题为“谈记忆”。)

[案例1] 赋分等级1分的作文:

我对这个主题的观点是反对记忆(后半句的拼写与表述有误)。人们的成功就是靠重复他们的记忆。他们也许有可怕的记忆但是也成功,因为他们不重复自己的过去。我也认为记忆不应该束缚现在。假如你让过去压制了你还没有在任何地方得到的现在,这就是为什么记忆应该成为指导原则,而非束缚。假如你重复那一去不返的过去,因为世界已变。过去也绝不会随世界而变;但是世界会变而去压制过去,所以我的结论是不要忘记过去或在过去的生活,过去仅仅是指导原则。

阅卷老师的评语:

微型作文几乎没有显示出作文清晰的线索,在作者观点的支撑方面,提供的仅仅是一般观点的罗列(如“不要忘记过去或在过去的生活,过去仅仅是指导原则”)。呈现的证据组织杂乱,中心不突出,这导致了一个松散的作文。为了获得高分,本文作者需要提供另外的能突出中心的证据——这能展开观点,包括具体的事例。本文几乎没有显示出作文清晰的线索并因此得1分。

[案例2] 赋分等级6分的作文:

没有过去,我们的未来将会是一条布满荆棘前途迷茫的道路。为攀登成功和辉煌之梯,我们必须正视过去并将其融入我们未来的生活。即使过去我们犯了错误,但吃一堑长一智,且指引我们走向希望的所在。

在过去的某一年,我当时正在饰演秋季剧——“热的锡屋顶上的猫”(Cat on a Hot Tin Roof)。糟糕的是,我以为为准备演戏而去看电影是一个好主意。为此我花了两个小时琢磨伊丽莎白·泰勒夸张怪异的表演、态度和独白,希望我能模仿她的表演。我饰演“麦姬”(Maggie)的角色,我对演伊丽莎白·泰勒的角色深感自信,然而我没有意识到我的导演已经看到了我确实在想什么。当然,非常不幸,我没有得到那一角色,导演告诉我,他需要看到我自己的“麦姬”而非“伊丽莎白·泰勒”的“麦姬”。

我从这一经历中认识到,为创造自己的人物性格,我没有必要努力模仿他人的角色。仅仅在两个月后,我准备去饰演冬季剧。剧本是Neil Simon的《谣言》,我饰演克里斯(“Chris”)——一个讽刺的然而富于机智的角色,这将是我高中阶段最后一次表现。为了演好我的角色,我以我想象的她应该的样子计划她的生活,以我以为是她的恰当的语气谈吐,她性格的其余方面也由此漂亮地展开。在第一次饰演后,导演告诉我,从我这儿,《谣言》变成了他曾看到过的最好的作品,并说他惊奇地发现,我饰演了如此可信的人物性格。回想我初次演戏,我感谢那次让我学会成长的机会,因为没有那次错误,我也许得努力以我知道的某人或看到的某事为标准误解克里斯这一角色,而不能变成自己的人物性格。到目前为止,我利用伊丽莎白·泰勒溃崩的记忆去改进我表演的方法,并在我生活中做最好的表现。

阅卷老师的评语:

本文通过清晰、得体、详细地描述作者做演员的事例,深刻而有力地展开了观点(如“为攀登成功和辉煌之梯,我们必须正视过去并将其融入我们未来的生活”)。本文借呈现组织良好、中心突出的叙述——适宜地说明了记忆的价值——展现了卓越的批判性思维。本文也巧妙地使用了语言,表现了句子结构的丰富性与多样性(“糟糕的是,我以为为准备演戏而去看电影是一个好主意。为此我花了两个小时琢磨伊丽莎白·泰勒夸张怪异的表演、态度和独白,希望我能模仿她的表演。我饰演‘麦姬’(Maggie)的角色,我对演伊丽莎白·泰勒的角色深感自信,然而我没有意识到我的导演……”)。瑕不掩瑜,本文线索清晰连贯,得6分。

美国SAT作文的赋分标准,等级清晰,且六个等级只贯穿一个标准——“线索”(正面),而不足之处也只贯穿一个标准——“小错或瑕疵”(反面),即以线索是否清晰连贯,瑕疵的多少来评定等级。实际上,线索既体现了语言表达的能力,更能看出逻辑思维的水平;而瑕疵的多少也能反映学生语言及思维的水平。所以,在以学术性研究为主的SAT的考测中,抓住这两个标准,评分就简便易行了。

2.中观层面

教材或《教学基本要求》中的具体的评价标准,既便于学生自查,又呈现了写作知识。

《美国语文》一书中的写作练习常常同时提供写作学习任务和写作评价标准,很有助于教学。比如下面一组练习:

[作文题] 和一组同学一起选择一个你们认为应该改变的学校里的问题或情况。然后写一封给校长的建议信,解释为什么这种情况需要关注,以及你们认为这种情况需要改正的原因。

[写作评价标准]

1.恰当地运用因果关系。

2.使用了有力的语言使论证具有说服力。

3.列出必要的细节支持每一种原因。

4.使用礼貌正式的语言。

5.论点清晰,段落安排具有条理性。

3.微观层面

教学中的日常评估,则更能跟踪学生学习,促进学生发展。

绝大多数的教育评估发生在课堂里,发生在教师和学生的互动中。这些微观层面的评估渗透在每一天、每一月、每一年的学习中,发挥着不可估量的作用。教师设计、布置、观察、参与和阐释学生在课堂里的学习活动,并赋予意义,同时评估学生的学习状况,因此,教师的日常的过程性、表现性评估成为评估的主要“代言人”。正是他们持续的形成性评估影响着学生的学习。这些时候,评估已不再是技术程序,评估所呈现出来的教师看待学生的方式,影响着学生看待自己的方式,甚至影响着他们未来的学习方式和看待自己的方式。所以,教师格外需要提高自己在评估方面的专业性,充分发挥日常评估的有效性。

教师的日常性评估应该具有以下特征:

(1)明确。能具体反映学生知识、技能、策略或态度各个方面的具体状态,能说明学生要做什么,做到怎样。

(2)及时。因为学习的需要、兴趣和热情会随着时间、情境的变化而变化,如果不能及时提供评估信息,可能就会错过影响和促进学习的机会。

(3)谨慎。评价标准要贴合学生实际,否则有可能使学生处于一种防卫的状态,从而抑制学习。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈