学分制下高校课程考试试卷的等值问题

时间：2023-03-09 理论教育版权反馈

【摘要】：基于CTT理论下的难度指标等值法。为此，我们可利用EST理论方法，依靠课程专家的考评经验，为每份试卷的题目难易程度进行模糊评估。不同课程考试卷面成绩之间以及相同课程不同次考试的卷面分数之间一般是不可比和不等值的。甚至通过必要的题目调整，使得每份试卷的及格线都接近60分，以符合我们对成绩分类的传统习惯，同时也实现了不同次考试成绩之间的等值效果，提高实行学分制下高校课程考评的科学性与合理性。

三、学分制下高校课程考试试卷的等值问题

如前所述，为区别学习成绩的优劣，通常的办法是实行课程学分绩点制，不同档次的考试分数，应判给不同的课程绩点。换句话说，我们需要给学生的考试成绩进行分类，并赋予不同的课程绩点。这就给我们提出两个重要的问题:一是我们采取何种标准对学生的考试成绩进行分类，二是我们应采取何种方法来保证相同课程的不同次考试成绩及其我们对成绩进行分类的标准具有可比性。从教育测量与评价的角度看，解决这些问题的方法是采用测验等值技术。下面分别介绍两种不同的成绩分类方法下和若干可行的测验等值方法。

1．考试成绩的现象分类及试卷等值方法

对考试成绩进行分类时，人们普遍采用的是现象分类，比如习惯上人们常把90—100分评为优，并赋给单门课程的最高绩点数;80—89分则评为良，赋给次高的绩点数等;依次类推，传统习惯上把60分以下的判为不及格，因而没有课程绩点数，必须通过重修或改修等方式去获取课程学分绩点。可以说，这种分类方法已成为传统，而且最简便，人们容易接受、乐于采纳。但为了保证考试质量、稳定考试标准、提高不同次考试成绩之间的可比性，就必须在题库或卷库建设中采用测验等值方法，保证不同试卷之间具有较好的可比性和等值性。常用的等值方法有如下两种。

(1)基于CTT理论下的难度指标等值法。当某门课程题库已建立起来，并且对所有题目都取得CTT理论下的难度值指标时，我们就可逐一地分析与统计每份试卷的所有题目的加权平均难度和各种难度区间下的分数比重，即试卷的难度及试卷题目难度的分布状态特征。假如每一份试卷的这两种状态特征都相同或都很接近，则我们便实现了试卷间的难度等值，从而在一定程度上保证课程考试标准的稳定性，提高不同试卷下考试成绩之间的可比性。但假如不是每份试卷的上述两种状态特征都很接近，就要遴选一份较满意的试卷为参照卷，然后通过调整有关试卷中的题目，直至其他各份试卷的上述两种状态特征均与参照卷很接近才可。这里的调整方法，实际上是以参照卷为准绳，对其他试卷进行难度结构上的校准(calibration)。

(2)基于EST理论下的题目难度专家评估等值法。许多情况下，当课程题库或卷库建设处于起步阶段或处于初级水平上时，所有的题目都没有经过测试取得参数。为此，我们可利用EST理论方法，依靠课程专家的考评经验，为每份试卷的题目难易程度进行模糊评估。具体方法是由课程专家逐一考察每份试卷的题目，并对题目的难易程度从经验上进行分类，譬如分成难、中、易三类，或分成很难、较难、中等、较易、很易五类。然后统计出每份试卷各种难度层次的题目分数比重，并进行比较或调整，直至每份试卷的这种难度结构与分布状态都相同或很接近才可。

2．考试成绩的本质分类及课程学分绩点的等值

不同课程考试卷面成绩之间以及相同课程不同次考试的卷面分数之间一般是不可比和不等值的。上述第一种从数量形式上用一种固定不变的准则对考试成绩进行分类并赋给相应的课程绩点的方法，虽然简便易行，但缺乏对考试分数所揭示的能力水平作本质性的认知。考试成绩60分以上及格、60分以下不及格的评价标准似乎天经地义。但稍加思考，就不难发现，对不同课程或不同试卷的考试取得60分成绩所付出的心智代价是很不相同的。因此，我们可从标准参照性考试的性质特点及理念出发，采用若干方法来建立特定试卷的及格线与分类的临界分数，实现从课程内容本质上对考试成绩进行分类，达到课程学分绩点的等值效果。下面简要介绍几种不同的方法，供使用时参考。

(1)基于题目三分类下确定试卷及格线，这种方法是按照前述“教育目标三分类”或按照“易、中、难三分类”的思想，由课程专家对特定试卷中所有题目进行分类并统计出各类题目的占分比重，不妨记为W₁、W₂和W3。其次要求课程专家从考评经验出发，设想一个在课程学习上可接受的最低能力的学生，对其答对上述三类题目的百分比作出低限的规定，不妨记为P₁、P₂和P₃。最后，应用加权公式E₁=W₁P₁+W₂P₂+W₃P₃，求得该特定试卷的及格线E₁，(显然这里的E₁，未必等于60分)。按照类似的方法，同样可确定出中等、良和优成绩的的分界线，不妨依次记为E₂、E₃、E₄，则我们便实现了对考试成绩的分类标准。进一步地，对不同试卷按照上述同样方法进行操作，我们则可为每一份试卷建立起分类标准。从而，我们可在特定意义上实现某一课程考试成绩等级和课程学分绩点在不同次考试下的等值。

(2)基于题目双向分类下确定试卷及格线。这种方法是上述方法一的改进与深化，其主要思想方法是:由课程专家对特定试卷中所有题目按“考查目标层次”和“题目难度层次”进行双向分类，统计出各个小类的占分比重，记为W_ij。假如考查目标分成m个层次，难度水平分成n个层次，则可得到一个n行m列的分数结构矩阵，不妨记为W=［W_ij］n×m。其次，课程专家设想一个临界及格的、可接受的、最低能力的学生，答对上述各个小类题目的百分比，于是我们又得到一个n行m列的答对率结构矩阵，不妨记为P=［P_ij］n×m。最后，我们利用公式E₁=∑∑P_ijW_ij(这里i= 1，2，…，n;j=1，2，…，m)，求得该特定试卷的及格线E₁。按照类似的方法，我们可分别确定出其他成绩等级的分界线。若对卷库中的每一份试卷重复上述一系列步骤，则可为所有的试卷建立起各自的成绩分类标准。

不难理解，通过评估试卷及格线及各类成绩等级分界线的方法，实际上是从改变、调整不同试卷下成绩分类标准(即分数量尺上的临界点E₁、E₂，E₃和E₄)，去实现不同次考试成绩等级之间以及课程学分绩点之间的等值。这类方法有较好的科学性，但操作起来有一定的技术要求和困难。除非是针对一些大规模的关键性的考试，高校一般课任教师不容易接受。特别是不同试卷采用不同的成绩分类标准去判定学业等级，不便于管理。为此，我们可以通过对试卷题目的调整，使不同试卷的及格线之间以及其他相应分界线之间大体相等，即可稳定各份试卷的成绩分类标准。甚至通过必要的题目调整，使得每份试卷的及格线都接近60分，以符合我们对成绩分类的传统习惯，同时也实现了不同次考试成绩之间的等值效果，提高实行学分制下高校课程考评的科学性与合理性。

【注释】

[1]参见蒋建洲主编:《普通教育评价教程》，广西师范大学出版社1991年版，第40-42页。

[2]R．A．Berk，A guide to criterion-reference Test construction，the Johns Hopkins University Press，1984，chapter Seven．

[3]参见黄光扬:《论自学考试课程考试大纲的结构与编写模式》，载于《福建师范大学学报》(哲学社会科学版)1994年第4期。

[4]参见漆书青、戴海崎:《项目反应理论及其应用研究》，江西高校出版社1992年版，第12—16页。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈