首页 理论教育 标准参照测验的题目分析

标准参照测验的题目分析

时间:2022-02-27 理论教育 版权反馈
【摘要】:迄今为止,两种一般性的题目分析方案已经被采用,这些分析方案以学生分组的有效性为基础。另一种标准参照测验的题目分析方法需要设置两个不同的学生组,其中一组已经接受了教学,而另一组则没有。如果您使用两个组——一个接受过教学的组和一个未接受过教学的组——其中一个更易懂的题目的题目辨别指数是Duigd。Duigd指数的值的范围是从-1.00到+1.00。

教师使用测验时参照标准对结果进行解释,他们都希望在实施教学之后,大多数学生能够在测试中得到好的分数。举例来说,由于教学后测验题目的p值接近1.0,传统题目分析就会得出低的题目辨别指数。因此,很多种替代标准参照测验旧方法的新方法在近几年中被设计出来。

迄今为止,两种一般性的题目分析方案已经被采用,这些分析方案以学生分组的有效性为基础。与区分度指数类似,这两种题目分析方案都被随意地与常模参照测试一起使用。第一种方法涉及对同组学生进行教学前与教学后的施测问题。这种方法的缺点是教师必须等教学完成之后才能获得可靠的题目分析数据。另一个问题是,前测可能有影响,在这种情况下,前测的实施会使学生对某些题目产生敏感,这样学生在后测中的表现实际上是教学和前测共同作用引起的。

运用测试同组学生在接受教学前与教学后的情况的策略,我们可以用如下方式来计算题目辨别指数:

Dppdppostppre

其中,ppost=在后测中正确回答题目的学生的比例

ppre=在前测中正确回答题目的学生的比

Dppd(基于前测与后测的差异的辨别度)的值的范围是从-1.00到+1.00,如果得到的是高的正数值,就表明该题易受教学的影响。

例如,在前测中有41%的学生回答对了第27题,在后测中则有84%的学生回答正确,那么第27题的Dppd就应该是0.84-0.41=0.43。高的正数值表明题目受到了您提供给学生的教学方法的影响。如果题目的Dppd值很低或者是负数,那么就需要作进一步分析。因为如果教学是有效的,那么这些题目就没有表现出所期望它们表现的东西(这种情况总是有可能的,尤其是如果很多题目未能表现出前后测的差异的时候,那么这样的教学是不理想的)。

另一种标准参照测验的题目分析方法需要设置两个不同的学生组,其中一组已经接受了教学,而另一组则没有。通过对比接受了教学的学生与未接受教学的学生在题目上的表现,您可以得到关于题目质量的一些有用的线索。这种方法的优点是可以避免拖延建立同组学生前测与后测联系的时间,并且可以避免前测的影响。其缺陷是在选择“受过教学”与“未受过教学”的组时,必须依靠人工评判。这两个组在其他有关方面(例如智力水平)应该是完全相同的,其区别仅仅在于是否接受过教学。隔离两个组的办法听起来比较容易,实际上您的最佳选择是说服其学生正在学习不同主题的教师参与进来。

如果您使用两个组——一个接受过教学的组和一个未接受过教学的组——其中一个更易懂的题目的题目辨别指数是Duigd(以未接受过教学组与接受过教学组的差异为基础的辨别度)。这个指数通过如下的方式来计算:

Duigdpipu

其中,pi=接受过教学的学生中正确回答某道题目的学生所占的比例

pu=未接受过教学的学生中正确回答某道题目的学生所占的比例

由于时间的限制,一些教师没有时间去修饰自己的测验。所以,作为一个实际问题,很少有教师愿意花哪怕是一点时间去完善他们的课堂评价。这些都是可以理解的。

但是在本章中描述的两种题目完善方法,其中之一——评判性完善策略不需要花费过多的时间。它是一种用于完善题目的评判方法,这种方法对于任课教师来说是一种现实的题目完善模式。

但是教师应该理解通过运用基于学生反应的经验数据完善测试的基本原理。他们很少倾向于使用这些以数据为基础的策略去完善题目,除非这项测试是超乎寻常的重要。

在UCLA教育研究生院讲课的29年中,我仅在年年都教的课程的期中和期末考试中使用经验性题目完善分析测试。当然,需要认识到的是,在其他的大多数测试中,我都使用了评判完善策略,但是我仅有的、完全以数据为基础进行完善的测试,是一项或两项对我经常教的课程来说最重要的测试。

我担心的是经验性题目完善策略表面的复杂性,可能会阻碍您使用常规的评判题目完善方法。不要放掉它。如果您从不使用学生的数据完善课堂测试,那么这些测试将一直需要完善。评判的方法将帮助您完成这项工作。

Duigd指数的值的范围是从-1.00到+1.00。为了进一步说明其计算方法,如果接受过教学组的学生中有91%回答对了某道题,同时未接受过教学组的学生中只有55%回答对了同一道题,那么Duigd就是0.91-0.55=0.36。关于Duigd的解释类似于Dppd

如前所述,综合运用评判性的和经验性的方法对完善您的课堂评价方法将具有明显的帮助。实在地说,教师也只能消耗这么多精力。如果能够准备一点您可以分配的精力去完善您的评价工具,您通常会发现关于工具质量的有意义的差异。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈