首页 理论教育 新旧版《普通话水平测试大纲》的评分项与评分标准比较

新旧版《普通话水平测试大纲》的评分项与评分标准比较

时间:2022-03-29 理论教育 版权反馈
【摘要】:三 新旧版《普通话水平测试大纲》的评分项与评分标准比较03版《大纲》根据连续性与前瞻性相结合、科学性与可操作性相统一的原则,在测试的性质、测试的对象和范围、测试的内容、测试项的目的和要求、测试评分标准等方面均作了修订,其中,尤为引人注目的是在评分项设置、评分结构安排、分值分配等方面作了较大的调整。

三 新旧版《普通话水平测试大纲》的评分项与评分标准比较

03版《大纲》根据连续性与前瞻性相结合、科学性与可操作性相统一的原则,在测试的性质、测试的对象和范围、测试的内容、测试项的目的和要求、测试评分标准等方面均作了修订,其中,尤为引人注目的是在评分项设置、评分结构安排、分值分配等方面作了较大的调整。调整的重点是“朗读短文”和“命题说话”两个测试项。

(一)“朗读短文”测试项评分标准的调整

1.测试项名称与测试目的

《普通话水平测试实施纲要》“总论”部分指出:“普通话水平测试一律采用口试方式。测试的内容包括有文字凭借的和没有文字凭借的两部分。”“朗读短文”属于有文字凭借的测试项之一,是一个比较大的测试项,分值为30分。94版《大纲》将这一测试项定名为“朗读”,从一定意义上来说是有失偏颇的。因为“朗读”既可以包括朗读文章,也可以包括朗读字、词、句子、段落等,范围比较广。03版《大纲》将测试项名称改称为“朗读短文”,定位比较准确,表述比较科学,测试项的目的指向性也比较明确。同时,根据对普通话水平测试的性质的重新审视与理解,03版《大纲》对“朗读短文”这一测试项的测试目的的表述也进行了一定的修正。

94版《大纲》与03版《大纲》“朗读短文”测试项目的表述比较

img5

第一,03版《大纲》将测查的内容由“书面材料”改成了“书面作品”,释义相对比较科学、精确。因为“材料”一般是没有经过加工处理的,规范性不够,而“作品”则是经过加工(创作),需要斟字酌句,比较符合语言规范化和语言测试的要求。

第二,03版《大纲》没有将“语音”列为“重点测查”的范围。这样的处理并不是对应试人的语音标准程度不再加以评判,而是根据各测试项的实际情况将它作为一般测查项目来处理。因为通过第一、二测试项的测试,主试人对应试人的声母、韵母、声调等的发音已有较为详细的了解,在这里不需要再进行像第一、二项一样的详细分析,只需要将错误的音节加以记录扣分即可,评判比较容易。

第三,增加了“停连”与“流畅程度”两个目的测试项。“连读音变、停连、语调以及流畅程度”是应试人在朗读短文时必须把握的项目,也是前两项测试中未予测查的内容,因此,需要作为重点来测查。考虑到94版《大纲》在设计评分项时,对此分类不够清晰,03版《大纲》进行了重新梳理,调整了各评分项的位置及分值。当然,从对普通话水平测试性质的理解出发,这一测试项在对评判目的测试项“连读音变、停连、语调以及流畅程度”的分值分配设计时,其分值不可能占很大的比例,03版《大纲》设计的最大扣分值上限也只有6分,占本测试项总分值的20%。

2.限时与超时扣分

对“朗读短文”测试项进行时间的限定,是为了测查应试人用普通话对有文字凭借的书面作品进行表达的熟练程度。因此,应试人在规定时间内无法完成指定内容的朗读,必须扣分。

03版《大纲》对“朗读短文”测试项的限时没有变化,仍为4分钟。但值得注意的是,94版《大纲》尽管规定限时4分钟,但超时扣分却是从4分30秒之后再进行的,这中间30秒空档的存在,使人觉得难以理解。而且从实际操作情况来看,应试人读完全文(以字数最多的一篇朗读材料《海燕》为例,作品46号,共578字),也用不了4分钟。用时达到4分钟以上,只有两种情况:一是考前未经过训练,对文章不熟悉,用字化、词化的方式念文章,或有较多的回读;二是拖腔拖调,表演性太强,令人难以忍受。但这两种情况毕竟比较少,03版《大纲》对此采用分类扣分的办法,分别归入“语调偏误”、“停连不当”等测试评分项中扣分。另一方面,03版《大纲》在选择朗读材料时已充分考虑了全文的字数,并且明确要求“应试人应将第400个音节所在的句子读完整”,即限时实际上只是对读完400个音节而言。这样限时4分钟,已经是相当宽松的时间要求,不需要再留出30秒的伸缩余地。故只要应试人朗读短文时间达到4分钟(不含4分钟)以上,就可以按“超时”进行扣分(扣1分),这是一种限制性扣分。

3.测试项的目的评分项的评分办法

根据对测试项的测试目的的分析,03版《大纲》对“朗读短文”测试项的目的评分项分值分配、评分办法等作了相应的调整。

94版《大纲》与03版《大纲》目的评分项的评分办法比较

img6

通过以上比较分析,我们可以发现,03版《大纲》在目的评分项的语言表述上比较规范,目的评分项涵盖的范围也相对比较完整,分值的分布也比较合理,评分办法比较容易把握。

第一,字音扣分增加了“增读一个音节扣0.1分”。“增读”实际是增加了读错的机会,与“漏读”有回避难点字音之嫌不同。尽管如此,“增读”毕竟改变了原文,不得不扣分;扣分与错、漏同等对待,便于操作。

第二,新增加了“声母或韵母系统性缺陷,视程度扣0.5分、1分”这一评分项。朗读评分项中对字音的扣分是指有语音错误的字音可以扣分,而字音有语音缺陷却没有明确规定扣分。这对取得低分区的等级不会明显影响等级评定,而对高分区的等级来说,由于没有明显语音错误,虽有语音缺陷,但不能扣分,容易取得较高的分数,甚至影响到等级评定。另外,94版《大纲》评分项“方言语调”从理论上讲也不便包括“声韵缺陷”在内,这就形成了评分空白。增加此项评分可以弥补这个空白。

应当注意的是,这一新增加的评分项分值不多,并且必须是“系统性缺陷”才可以扣分。这就告诫测试员,必须充分理解这一评分项的内涵,对于应试人的语音错误较多(特别是成系统的),不要在这一评分项上扣分;对于应试人不成系统的语音缺陷,也不应随意扣分。

第三,03版《大纲》将许多测试员都较为敏感的、理解与把握上有一定困难的“方言语调”用新的概念“语调偏误”(intonational deviance)替代,这是较为合理的改动。在实际操作中,应试人对朗读语调的把握不够准确的情况除了受方言的影响外,还包括在学习普通话过程中出现的偏差。如全文均是句头重、句尾轻的重轻式,读书腔、唱歌式句调等,这种偏差就不应归入“方言语调”的范畴,将它归入“语调偏误”就比较合理。

对这一目的评分项的分值改动是将“扣1.5分”改为“扣1分”,去掉了扣3分档,并增加了一档,即扣0.5分。这样,评分要求降低了,对于测试等级评定为二级、三级普通话的应试者来说,更容易反映其真实水平。

第四,94版《大纲》规定“停顿、断句不当,每次扣1分”。对这个评分项的理解与把握,宋欣桥先生在1995年就提出,“此项评分在实际操作时,比较难把握。在目前试行阶段,除明显的停顿、断句不当外,不太明显或偶尔出现的,一般从宽把握,一次性扣分不超过2分为宜”(参见《普通话水平测试的范围、要求和评分办法》,宋欣桥,1995)。03版《大纲》将目的评分项改为“停连不当”,扣分时“视程度扣0.5分、1分、2分”,起分点定为“0.5分”。这对数量有限、一般不太明显的停连不当现象,较为适合。对于普通话水平较低,由于表达不流畅而造成表达不够合理的情况,宽容度明显增加了;而对于不认真准备,文章生疏,断断续续,甚至出现字化、词化现象的,就可以扣2分。

第五,“朗读不流畅(包括回读),视程度扣0.5分、1分、2分”,94版《大纲》没有明确规定这个评分项,而是体现(隐含)在“停顿”“语速”两个评分项中,容易使人产生重复扣分的感觉。而对“回读”(就是在朗读文章时,将句子或句子的某一部分重新读一遍的情况)这种情况的扣分在各省市的评分细则中表现是不同的,有的按字扣分,有的按次数扣分,现在统一将它归入“朗读不流畅”的评分项中,有利于减少评分的误差。同时,对朗读短文时所表现出来的流畅程度也体现了掌握普通话的第一层次要求:熟练程度。因此,将其单独设为一个目的测试项,是比较科学合理的。

第六,为了减少评分项内涵的交叉,避免重复扣分现象,94版《大纲》关于“语速”的评分项被取消。

(二)“命题说话”测试项评分标准的变化

1.测试项名称与测试目的

“命题说话”属于没有文字凭借的测试项,是普通话水平测试中最大的测试项,按“五项测试”(完整测试)设计,“命题说话”项占30分;按照“四项测试”(即免测“选择判断”项)设计,“命题说话”项占40分。94版《大纲》将这一测试项的名称确定为“说话”,但在实际操作中,一般情况均采用单项说话方式,这一方式较易为应试人和测试员所接受,因此实际上已成为事实性的命题说话。另一方面,由于采用双向对话很耗时,又对测试员提出了很高的控场、诱导、表达方式等方面的要求,在目前测试人数较多、测试对象层次比较复杂的情况下,采用这一方式显然不太合理,也不太现实。因此,03版《大纲》暂不考虑增加“会话”测试项,而明确将其定位为“命题说话”,限制了说话的类型,这是比较现实也比较科学的做法,遵循了《普通话水平测试实施纲要》提出的“测试题目必须尽可能兼顾信度和效度的统一”的要求。

按照《普通话水平测试实施纲要》“总论”部分“无文字凭借的说话部分,全面(语音、词汇、语法)检测和评估应试人使用普通话时所达到的规范程度”的要求,03版《大纲》对于本测试项的测试目的,作了比较完整、科学的表述,弥补了94版《大纲》对重点测查范围未予表达的缺憾。

94版《大纲》与03版《大纲》“命题说话”测试项目的表述比较

img7

这里,03版《大纲》将“说普通话的能力”改述成“说普通话的水平”,表达比较科学、合理。“说普通话的能力”一般的理解是“语言能力”,它包括对普通话的基本知识的掌握情况(语言),用普通话进行表达的情况(言语);“说普通话的水平”主要指的是言语表达情况,包括熟练程度和规范程度。

03版《大纲》还同时确立了“测查重点”,即“语音标准程度,词汇、语法规范程度和自然流畅程度”。这样,测试项的目的表述就比较完整,测试目的评分项的确立就有了依据。

2.测试目的评分项

(1)语音标准程度

94版《大纲》与03版《大纲》“命题说话”项语音标准程度分档评分标准比较

img8

第一,03版《大纲》将说话项评分中的“得分”改为“扣分”,“语音失误”改称“语音错误”,使前后测试项表述一致,同时也有利于测试员测评操作。

第二,94版《大纲》“语音面貌”(03版《大纲》表述为“语音标准程度”)档线分的上下限不明确,测试员对档间分的得分理解存在比较模糊的倾向,如“二档”得分18分,正确的分值应该是18分、19分,还是18分、17分,能不能扣0.5分,《大纲》均未规定。03版《大纲》表述了档间分,如“二档”就可以扣1.5分、2分,使评分更加合理、科学、明确,可操作性更强。

第三,总结测试实践,语音标准程度“一档”不出现一点失误的情况很罕见,不扣分的情况也很少出现,因此03版《大纲》首先修改了评分依据,增加了“或极少有失误”的表述,并增加了扣0分、0.5分、1分的评分。将扣分的起分点定为0.5分,是考虑到高等级水平的应试人的语音错误量极少,扣1分偏重,但不扣又偏轻的实际情况。而且普通话水平越高,语音错误量越少,扣分应越精细。所以在“一档”、“二档”设置了0.5分的扣分。实际上,0.5分也可以作为该项评分操作中最小的扣分起点。

对于说话项的评分标准,03版《大纲》有一段文字说明:“各省、自治区、直辖市语言文字工作部门可以根据测试对象或本地区的实际情况,决定是否免测‘选择判断’测试项。如免测此项,‘命题说话’测试项的分值由30分调整为40分。”94版《大纲》对此没有明确规定。但在许多省市的测试实践中,一般是免测“选择判断”项的,同时将“选择判断”项的10分加入“说话项”。这与03版《大纲》是一致的。问题是这10分加到哪个评分项中。一般的做法是将这10分加到“语音面貌”中,这实际上是加大了测试的难度,降低了应试人的实际分数。03版《大纲》修正了这种做法,明确规定:变为“四项测试”后,“命题说话”测试项的评分档次不变,“语音标准程度”的分值调整为25分,“词汇、语法规范程度”的分值调整为10分。

“五项测试”与“四项测试”语音标准程度分档评分标准变化情况

img9

上面提到,普通话水平测试等级在一级甲等与一级乙等高分段的,一般语音错误量较少,扣分的精密度理应比较高。“五项测试”中的“命题说话”项的语音标准程度“一档”扣分设置比较合理,以0.5作为扣分起点,比较容易把握。但“四项测试”中,由于“命题说话”分值加大,“语音标准程度”“一档”的扣分值达到2分,因此更有必要以0.5分作为起扣分。各省市在制定评分细则时可以适当进行调整,将“一档”的扣分细化为“扣0分、0.5分、1分、1.5分、2分”。

(2)词汇、语法规范程度

94版《大纲》与03版《大纲》“命题说话”项词汇、语法规范程度分档评分标准比较

img10

首先,03版《大纲》将此目的评分项的“得分”改为“扣分”使前后测试项表述一致,同时也有利于测试员测评操作。

其次,03版《大纲》增加了扣分的分值:“一档”不变。“二档”增加了“扣0.5分”的操作项,这比较适合于只有极少词汇、语法失误的情况。“三档”则将最低扣分值定为2分,并增加了扣3分的操作项,这对于词汇、语法有较多不规范情况,但想取得较高等级的应试者来说,是一个警告。同时也是对普通话水平测试的性质的一个合理解释:普通话水平测试不仅测试应试人普通话的熟练程度,更重要的是要测试规范程度;普通话水平测试的最终目的是为了推广普通话,推广普通话不仅仅要解决发音问题,还要解决词汇、语法等一系列问题。

这一目的测试项扣分分值的增加,也是考虑到普通话测试对象和范围的扩大,应试者水平有向低等级延伸的趋向这一实际情况。应试人普通话水平等级越低,出现词汇、语法不规范的情况就会越多,就越要注意解决词汇、语法的不规范问题。

另外,由“五项测试”改为“四项测试”后,“词汇、语法规范程度”的分值增加了,扣分值也相应增加,这对普通话水平等级在三级或二级的应试人显然是不利的。对于要拿到一级普通话水平等级证书的应试人来说,这也是一道限制的门槛。

“五项测试”与“四项测试”词汇、语法规范程度分档评分标准变化情况

img11

“四项测试”中的“词汇、语法规范程度”共占分10分,“二档”、“三档”的扣分分值也均相应提高了1分。

(3)自然流畅程度

94版《大纲》与03版《大纲》“命题说话”项自然流畅程度分档评分标准比较

img12

与前两个目的评分项相同,03版《大纲》也将此目的评分项的“得分”改述为“扣分”。

在“评判依据”方面,03版《大纲》在表述上有一定的变化:

首先,加入“语言”作为主语,明确了测试目的。

其次,“二档”中将“有背稿子的表现”与“基本流畅”、“口语化较差”并列,作为命题说话时表现出来的三种现象之一进行评判,区别了“口语化较差”与“背稿子”两种现象的不同。由于自普通话水平测试开展以来,应试人用背稿子的办法来对付“说话”项的测试现象比较普遍,特别是教师与学生的测试,这种现象更多。作为普及阶段,用背稿来应付测试未尝不可,而且在一定程度上背稿对提高普通话水平也有一些作用;但在提高阶段,背稿就不能真正反映应试人的水平,测试结果的信度就受到了质疑。如何科学地看待、合理地评判普通话水平测试中的“背稿”现象,是一个值得研究的课题。

再次,“三档”的评判依据变化较大。根据本测试项名称“命题说话”的含义,普通话水平测试不再适合用双向对话来弥补说话时间的不足,因此需要去掉“说话时间不足,必须主试人用双向谈话加以弥补”的表述,另设“缺时扣分”评分项;同时,用“语调生硬”替代“语速不当”使评判涵盖的范围扩大,因为“语调”实际上包括语速、节奏、轻重音、停连等一系列问题,相对于“语速”,“语调”更能体现“自然流畅程度”的实际内涵。

在分值设置方面,尽管总分未变,但扣分值增加了1分,说明“命题说话”项对“自然流畅程度”的要求提高了。

3.时间控制

对命题说话测试项进行时间的限定,一是为了测查应试人掌握普通话的水平,二是为了获得一定量的测查素材。因此,应试人无法完成一定时间量的语言测试,应扣分。但如何扣分,倒是一个实实在在的难题。

94版《大纲》规定:如果“说话时间不足,必须由主试人用双向谈话加以弥补”,就应将应试人的“自然流畅程度”判为三档,即扣2分。但在测试实践中,发现说话不满3分钟的情况比较复杂,甚至发生应试者有意减少说话时间的取巧情况而难以扣分,作出较为详细的规定很有必要。

03版《大纲》删除了“说话时间不足,必须由主试人用双向谈话加以弥补”这一表述,即说话时间不足,不再在“自然流畅程度”上扣分,而单独将它作为一个评分项目进行评分:“说话不足3分钟,酌情扣分:缺时1分钟以内(含1分钟),扣1分、2分、3分;缺时1分钟以上,扣4分、5分、6分;说话不满30秒(含30秒),本测试项成绩计为0分。”

这里,特别要注意的是“说话不满30秒(含30秒),本测试项成绩计为0分”这一标准,这是针对那些说不了几句话却想蒙混过关的应试人实施的重判。说话时间不足30秒,说话量就不足,就无法评定应试人的真实语音面貌、无法知道应试人的词汇、语法规范程度,也就无法对应试人在无文本依托的状况下的语言状况作出评判。这些规定是要告诫应试人必须认真说够3分钟,不然成绩会大受影响。

尽管如此,相对于其他类型的语言测试,普通话水平测试的“缺时扣分”还是比较温和的。其实,说话项测试的情况比较复杂,由于应试人说话节奏的快慢不同,3分钟所表达的音节量可以相差一倍以上,而音节量的多少,又直接影响“语音标准程度”的定量(语音错误量);同时,说话时间不足,尽管有一定的扣分,但可以用于评判的音节量却明显不足。面对这两种情况,该如何评判应试人的“语音标准程度”、“词汇语法的规范程度”、“自然流畅程度”,03版《大纲》对此没有明确规定,这是需要继续加以研究的一个课题。

94版《大纲》对此问题的处理是延时。尽管这一操作办法没有明确显示在《大纲》中,但我们可以通过“不得少于3分钟,说满4分钟主试人应请应试人停止”这一表述得到启示。不得少于3分钟是一条杠,如果应试人说话节奏比较缓慢,或用双向对话而影响总的音节量,这后面的1分钟就可以适当加以弥补。这一操作办法是否也可以适当地改进并加以利用呢?

另外一个问题是,应试人尽管说话时间达到了3分钟,但在表达时穿插了较多的音乐、舞蹈、哭泣等与测试目的不一致的成分;或用背化学元素表、数学公式等使测试员无法或难以理解所表达的内容。这样的情况该如何处理,也是需要进行探讨的。

对于离题、背稿等情况,测试员在评判时觉得把握难度较大,也比较难扣分。03版《大纲》在命题说话项的要求中列有这么一条:“如发现应试人有明显背稿、离题、说话难以继续等表现时,主试人应及时提示或引导。”提示或引导毕竟是一种附加手段,属于测试的干扰因素,如利用不当,会造成应试人紧张、慌乱,影响正常测试。因此,如何合理利用提示或引导程序,抑或经提示或引导之后没有效果或产生相反效果,该如何处理,《大纲》未予明确,这又是一个值得研究的问题。

4.其他评分标准的变化

在等级评定方面,涉及“朗读短文”与“命题说话”评分的还有一条。

94版《大纲》对第五题(指说话项)的评分有以下表述:“语音面貌确定为二档(或二档以下),即使总积分在96分以上,也不能入一级甲等;语音面貌确定为五档的,即使总分在87分以上,也不能入二级甲等;有以上情况的,都应在级内降等评定。”

03版《大纲》删除了以上表述,只以总积分来评定等级。

03版《大纲》评分标准的调整是具有延续性和前瞻性的,是一种科学化的探索。普通话水平测试毕竟是新设置的国家级考试,许多方面还处在探索发展之中,有些问题仍需要进一步研究论证,评分标准的确立也需要与时俱进,不断地进行修订、完善。我们相信,在广大语言文字工作者的共同努力下,普通话水平测试工作将会越来越走向成熟。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈