首页 理论教育 提高普通话水平测试信度的必要条件

提高普通话水平测试信度的必要条件

时间:2022-03-29 理论教育 版权反馈
【摘要】:培训还为交流各地测试经验提供了方便条件,使国家级测试员培训班成为研讨普通话水平测试的教研基地。采用双人组或三人组测试,还分为“商议打分”和“独立打分”两种形式。过去的语言测试已经证明,“双人商议打分”比“双人独立打分”信度低,常常出现各执一词、争执不休的僵持局面,或是出现迁就评分的现象。相比之下,“商议打分”浪费时间,效率低。

三 提高普通话水平测试信度的必要条件

我们已从宏观和微观角度分析了大规模主观性测试提高信度的困难,现在有必要探讨一下提高普通话水平测试信度的必要条件。

我们从以下几个方面探讨这个问题。

(一)统一认识,统一评分标准

测试实施机构和测试员要充分认识普通话水平测试对推动普通话普及和提高的意义,要努力维护普通话水平测试的严肃性和权威性。要遵照国家通用语言文字法,严格执行国家颁布的全国统一的普通话水平测试等级标准和测试大纲,这是提高测试信度的保证。

(二)重视对测试员的培训和再培训

普通话水平测试的性质决定了我们不仅要提高试卷信度,同时也要提高测试员信度。测试员培训是提高测试员信度的重要环节。

1.重视测试员资格考核

培训测试员不可能从最基本的语言常识讲起,培训时间毕竟是有限的,因此参加测试员培训要有个基本条件。测试员只有省和国家两级,入选资格的起点应该较高。测试员最基本的专业条件:具备大专以上学历;自身普通话口语水平达到一级乙等;有较高的语音分辨能力。有关文件还有其他方面的具体要求,测试员首先要根据规定的条件进行选拔,要接受专门的培训和考核,考核合格才能获得测试员资格。

无论省级测试员还是国家级测试员都要严把考核关,坚持标准,宁缺毋滥。

2.省级测试员和国家级测试员在培训内容方式上应该有所不同

省级测试员培训应该重视系统的测试能力的基础训练,包括对测试大纲的理解,以及语音分辨训练、分项评分训练、综合评分训练、定量定性训练等各种专项训练。培训内容应以评分操作训练为主。基础理论知识讲授应同测试有紧密关系,内容尽量精练而有针对性。培训中对学员的普通话口语水平的提高要有所指导。提高学员自身的普通话水平对学员胜任测试工作有直接的作用,培训应包括字词正音训练、朗读基础技能训练、说话基础训练等。

国家级测试员培训则应有所不同。测试员的基础训练已不是这类培训的主要任务。培训内容应包括两个方面:一是统一认识;二是统一评分标准。统一认识,是指通过培训明确普通话水平测试的性质、目的,树立维护国家级考试的严肃性和权威性的责任感,同时能奠定一定的普通话水平测试的科学理论基础。统一评分标准,是指通过培训进一步明确国家等级标准、各项评分要求,达到全国统一测试内容、统一评分标准的理想境界。通过培训,尽可能为学员解答在实际测试中出现的各类问题。培训还为交流各地测试经验提供了方便条件,使国家级测试员培训班成为研讨普通话水平测试的教研基地。

3.测试员必须进行再培训

无论是省级测试员还是国家级测试员,经过几年的测试工作后应该接受再培训,以适应测试工作发展的需要,这一点需要强制执行。测试员的再培训应包括:了解测试工作新进展;深化语言测试理论;解决测试中的焦点问题、疑难问题;接受有关部门的测试工作实绩考核和续聘。目前,已经有不少省市举办测试员再培训,这符合科学的发展,应该逐步形成制度,做到年年有交流,隔年有考核。

(三)优选适合普通话水平测试的测试员组合评分方式

普通话水平测试是由测试组执行测试任务。测试组由三人或双人组成。测试员除复审复核外一般不单独执行任务。任何级别和资历的测试员都无权以个人身份单独为应试者测试,更无权决定应试者的成绩和等级。

十几年的测试实践证明,采用三人或双人独立打分,必要时加入第三位测试员的评分方式比较适合普通话水平测试。从一般意义上说,通常采用三人测试组比双人测试组测试信度高。不过,只从测试组组成人数上比较还不全面,还要从评分的方式上看。采用双人组或三人组测试,还分为“商议打分”和“独立打分”两种形式。过去的语言测试已经证明,“双人商议打分”比“双人独立打分”信度低,常常出现各执一词、争执不休的僵持局面,或是出现迁就评分的现象。相比之下,“商议打分”浪费时间,效率低。事实上,“双人商议打分”与“单人有控制评分”信度相差无几。

从提高效率的角度,采用双人独立打分比较经济,也可以获得较高的信度。但同时要解决双人评分不一致时如何处理的问题,如出现不同等级的评分或评分差异较大等情况,解决的办法是在必要时请第三位测试员加入,以这三位测试员中的两个相同等级测试结果的成绩为准。当然,也可以通过复核复审解决此类问题。

应试人的最后成绩应该如何确定?是按其中高的分数确定,还是按低的分数确定?在相同等级分数段内,双人组以两名测试员各自独立打分的平均分值为应试者的最后成绩;三人组则以三名或两名(属多数)测试员相同等级的各自独立打分的平均分值为应试者的最后成绩。要说明的是,这两名或三名测试员在独立评分后的个体评分结果应受到尊重,不受职务职称、年龄资历、国家级还是省级等条件左右,有保留自己评分结果的权利。但同时测试员又应该依照测试的有关规定接受复审复核。

三人组成测试组对测试信度更有保证。可以用于特定的测试群体,如对国家级测试员的考核,对省级、国家级广播电视系统工作人员的测试,对港澳及境外人员的测试,以及各地考核测试员等。新测试员上岗的实习阶段,也可以采用包括新老测试员在内的三人组合测试组执行测试任务。“以老带新”,保证测试信度。

(四)控制每日的测试量

每日测试量(人数)是由测试内容所需要的时间决定的。

依据1994年测试大纲规定的测试内容:单音节字词;双音节词语;选择判断;朗读;说话。按限时依次计算:3分/3分/3分/4分30秒/3-4分,总计17分30秒。按照2004年实施纲要规定的测试内容:单音节字词;多音节词语;选择判断;朗读短文;命题说话。按限时依次计算:3.5分/2.5分/3分/4分/3分,总计16分。实际测试一个应试人的时间约15分钟。有的省市采用四项测试内容,约12-13分钟,扣除应试人进场、离场时间,以及安排测试员一个单元(半天)一次小憩时间,一个测试组每小时可以测试4-5人。按每日8小时计算,实际测试人数为30-40人。口语测试是高强度的脑力劳动,特别是集中测试二级或三级水平的应试人时,量化评分极为辛苦,考虑到测试员身体的承受能力,每日测试人数控制在30人左右为宜(每日极限数在40人以内。如集中测试以三级水平为主的应试人时,一般应控制在每日22-28人)。

每日测试量直接影响到测试的信度,这是普通话水平测试比较突出的问题。某些测试机构为了突击任务或追求经济收益,要求测试员超负荷工作,造成测试员过度疲劳,或测试员采用减少测试内容等的取巧方法应付,致使测试信度降低,难以保证测试质量。

(五)控制其他因素的影响

除以上四种保证信度的条件外,还有以下几种需要控制的因素:

1.考场地点集中。测试地点分散难以控制考场,也难以保证考场之间的一致性。应创造条件尽量使考场地点集中,这对保证测试信度是有利的。

2.应试人身份不为测试员所知。当应试人的身份为主试者知晓后,或多或少会影响测试员的评判,特别是知道应试者的达标“生命线”后,极易左右测试员的评判。我国现阶段测试是分行业进行的,常常是一类人一类人地进行,这对保证信度极为不利,应该充分注意到这个问题。

(3)随机分派测试员,随机分配评判对象。在测试现场,测试员和应试人才见面知晓,有利于提高测试信度。随机分派测试员、随机分配评判对象是最为可行的有效办法。因此,在测试前,测试员分组名单、应试人所在考场名单应该在一定程度上采取保密措施。总之,主观性测试信度对规模较小的测试比较容易控制,而规模较大则难以控制。如何提高大规模主观性测试的信度是世界语言测试的一大难题。普通话水平测试规模之宏大是世界各类语言测试难以相比的。我们可以这样说,普通话水平测试是对大规模主观性测试的一个伟大实践。从总体上看,我国现行的普通话水平测试信度较高。不仅试卷信度如此,测试员信度也是如此。只要我们努力关注理论研究与科学实验的结合,以及培训与测试的结合,就有理由相信,我们有条件、有能力解决这个难题,为世界语言测试的科学发展作出贡献。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈