首页 理论教育 评价的信度

评价的信度

时间:2022-02-27 理论教育 版权反馈
【摘要】:信度是一个如此受欢迎的事物。在教育评价领域,信度也颇受关注。然而,在与教育评价相关的因素中,“信度”有其严格的定义。在任何评价情景中,信度就是指多次测量的一致性。因此,只要在与评价有关的文字中看到信度一词时,信度和一致性之间就可以画等号。表2.1对本章中的三种信度证据作了简要的概括。

Reliability of Assessment

 

信度是一个如此受欢迎的事物。我们都期望汽车、洗衣机以及爱人是值得信赖的。信度(reliability)因其所代表的一致性而享有盛誉,它让人联想到夹肉的面包、马铃薯泥以及妈妈的爱。显然,信度是我们要努力达到的目标。

在教育评价领域,信度也颇受关注。毋庸置疑,我们期望教育评价真实可信。然而,在与教育评价相关的因素中,“信度”有其严格的定义。在任何评价情景中,信度就是指多次测量的一致性。因此,只要在与评价有关的文字中看到信度一词时,信度和一致性之间就可以画等号。

 

信度=一致性

 

教师的角度看,在日常教学活动中,信度这个概念主要体现在以下两个方面:第一,您的课堂评价有可能缺少信度,从而给您和您的学生带来不利影响;第二,如果您的学生被迫接受某种形式的商业性标准化测验,那么往往会有一两位家长,要跟您探讨一下这些测验是否合格的问题。正如第1章所描述的,诸如您所在州的NCLB测验,信度就是我们判断外部标准性测验的一个标准。您要对信度有充分的认识,这样当您向家长们解释如何根据信度来判断测验质量时,才能做到心中有数。

《教育与心理测验标准》(The Standards for Education and Psychological Testing,AERA,1999)是由美国教育研究协会(American Education Research Association)、美国心理协会(American Psychological Association)以及教育评价理事会(National Council on Measurement in Education)联合出版的刊物。该刊物是教育评价领域中公认的最重要的刊物,因为它反映了许多教育和心理测量学界顶尖专家的看法。如果您阅读《教育与心理测验标准》(1999)一书的第25页,您将发现证明“信度就是一致性”这一观点的有力证据。但是,《教育与心理测验标准》的作者也传递了一个明确的信息:儿童的测验成绩不是恒定不变的,对于这一点,相信多数有经验的教师早已有所体会。

 

行为测量成立的前提假设是个体或群体的行为有某种程度的稳定性。然而,对一个人行为的连续取样,这几次的样本之间几乎不可能在所有的方面都相同。在不同的场合,个体的表现、成果以及对一系列测试问题的反应都是不同的。即使在严格控制条件的情况下,这种差异性也是难以完全避免的。这种差异性反映在考生的测验分数上。一般而言,这种差异的原因与测量的目的无关。有可能是因为受测者投入了更大的努力,或碰巧猜的比较准确,或者注意力比较集中,也有可能是因为他有点紧张,或者某一次身心状态较好。由于测试题目只能反映某一领域的情况,而有的考生在这些领域恰恰比其他考生拥有更多的知识、经验。也许有些人的测验分数中的差异性不明显,但是没有人的分数是恒定不变的。由于这种差异性的存在,以及某些情况下计分过程中主观性的影响,个体所获得的分数以及群体的平均分数总是或多或少反映着测量误差。(AERA,1999)

 

此外,还有一种理解信度的方式,即信度反映着分数免受测量误差影响的程度。

然而,在教育测量中,一致性有三种表现形式,而不是只有一种。换句话说,人们主要用三种不同的方式来思考测量的一致性。假设这三种一致性是不能相互替换的,我们来考虑一下在教育测量中您可能会遇到哪一种情况?表2.1对本章中的三种信度证据作了简要的概括。

表2.1 三种信度证据

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈