首页 理论教育 普通话水平测试试题库建设背景

普通话水平测试试题库建设背景

时间:2022-03-29 理论教育 版权反馈
【摘要】:一 普通话水平测试试题库建设背景普通话水平测试试题库建设是一种综合教育测量学与应用语言学研究成果的多学科综合应用技术,是一个开放性的系统工程。根据《大纲》和《纲要》的要求,普通话水平测试题库将全部测试资料代码化,依照合理程序生成试卷,以进一步保证试卷的“等值”。这也是普通话水平测试走向成熟的重要标志。

一 普通话水平测试试题库建设背景

普通话水平测试试题库建设是一种综合教育测量学与应用语言学研究成果的多学科综合应用技术,是一个开放性的系统工程。其基本内容和实施步骤包括:确定题库建设的理论基础;根据普通话水平测试大纲确定测试的范围、题型、题量及测试方法;拟定编题计划;确立测试标准;命制题目;审定题目;拼组试卷;实施测试;评定并复查成绩;分析试题、试卷质量;搜集、整理、分析有关测试数据;确立测试规范;根据需要,组配命制若干套等值的规范试卷;检测教学效果,进行信息反馈,指导教学等。

题库建设的关键环节,是规范卷的研制。目前,国内外比较流行的题库建设理论有“经典测量理论”(CTT)和“项目反应理论”(IRT)。经典测量理论(CTT)以考生对题目的作答成绩作为真分数的估计值,并以此来确定题目的难度、区分度等数值,其数学模型的主要参数是样本的平均数、标准差、相关系数等。这种理论的数据解释容易为人们理解,有广泛的社会基础。它的最大局限在于,各种数据的获得有赖于考生团体样本的选取,抽样不当,就会严重影响数据的准确性。项目反应理论(IRT)以考生对题目的作答概率为媒介,并以此来确定题目的难度、区分度等数值,其数学模型的主要参数是题目反应曲线的特征参数。这种理论不受团体样本的影响,具有线性变换下参数估计的不变性,测试具有很高的精确性。但它的计算甚为复杂,有关数据的理解较为困难。

从普通话水平测试的口语特点来看,采用CTT建立题库有着更为现实的可能性和可操作性。采用CTT理论建立题库,关键是样本的选取一定要合乎规范,具有代表性。试卷样本必须有一定的数量,并且在平均分、各分数段的分布比例等方面应与试卷的总体尽可能相近,符合正态分布的原则,这样统计分析出的数据才有科学性、代表性。

从03版《大纲》看,有必要也有可能进行试题库建设。

《纲要》的“总论”里,全面地贯彻落实了《大纲》的规定和要求。结合对《纲要》各个部分的分析,“总论”部分拟定样卷的数据含量提高了。同时体现了普通话水平测试题库建设的基本思路。样卷根据声母、韵母在《词表》总音节数中所占的百分比,大致分别划分为四“档”。《纲要》的《普通话水平测试用普通话词语表》共17055条(统计时根据17066条,定稿后词条有调整,引用原统计,误差在1‰以内),其中单音节字词3197个,双音节词语13404个(音节数26808个),三音节词语342个(音节数1026个),四音节词语123个(音节数492个);总计音节数约31523个(按31500个进行计算)。

一档声母——出现频率在6%以上的:零声母,j,sh,x;

二档声母——出现频率在4%以上的:d,zh,l,h,b,g,q,t,ch;

三档声母——出现频率在2%以上的:f,m,z,k,p,r;

四档声母——出现频率在2%以下的:c,s,n;

一档韵母——出现频率在4%以上的:i,u,iɑn,ing,ɑn;

二档韵母——出现频率在3%以上的:‐i(后),ong,ɑo,ɑng,e,eng,uei,ɑi;

三档韵母——出现频率在1%以上的:en,iɑo,uɑn,in,ou,ɑ,ü,uo,‐i(前),uen,iou,ie,iɑng,ei,uɑng,iɑ,üe;

四档韵母——出现频率在1%以下(0.94-0.19-0.01)的:uɑ,o,üɑn,uɑi,iong,ün,er,ueng。

根据《大纲》和《纲要》的要求,普通话水平测试题库将全部测试资料代码化,依照合理程序生成试卷,以进一步保证试卷的“等值”。在此基础上再加以必要的人工干预,试卷的信度、效度有明显提升。这也是普通话水平测试走向成熟的重要标志。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈