首页 理论教育 测评目标框架及其制定需要体现统摄性

测评目标框架及其制定需要体现统摄性

时间:2022-03-29 理论教育 版权反馈
【摘要】:从第六章,我们了解到中国大规模数学测评系统在相应认知、观察和结果解释三个方面的表现,也了解到中国大规模数学测评系统内在一致性的缺乏。目前,中国大规模数学测评框架的内部构成是根据课程标准来制定的。这些在目前的中国大规模数学测评中正在引起重视。
测评目标框架及其制定需要体现统摄性_国际视野下大规模数学测评研究

从第六章,我们了解到中国大规模数学测评系统在相应认知、观察和结果解释三个方面的表现,也了解到中国大规模数学测评系统内在一致性的缺乏。内在一致性的不足,会直接影响到随后整个评价证据的形成,进而在推断上很难形成严谨的因果链。这也反映在框架的完备性和可操作性上,在试题表征及评分的实际反馈上,以及在结果解释上,都没有形成有效的因果链。这会影响评价结果的解释性,甚至现有大规模数学测评结果所呈现的单个分数值作为评价的唯一依据,也会容易引起人们质疑。基于此,需要明确如下几点。

1.明确的测试目的是框架制定的基础

无论是TIMSS数学测评,还是PISA数学测评,它们在测评目标分析框架的构成上都是紧紧围绕其考核目的展开的。如TIMSS通过课程分析,对各国的数学课程内容及要求进行详细梳理,并根据现有课程所体现的内容、表现期望建立框架。PISA则根据数学素养的界定和描述,特别是在数学过程中通过“数学化”的引进、数学能力的界定、能力群和问题解决阶段的划分,为考核学生的数学相关知识及能力水平奠定了基础。测评框架的构建不是一蹴而就的,这里存在着对于数学及数学教育本质的认识。相当多的理论基础性工作和问题需要解决和实践论证。

目前,在国内的大规模数学测评中,特别像中考数学测评中,很多省市都将毕业和升学的功能合二为一。这也使得在相应测评框架的制定过程中,框架内容及要求的确定变得非常困难,会出现框架中知识的认知要求应体现最低要求还是最高要求等问题。

新课程改革以学生的发展为本,体现培养数学素养的课程理念,使得国内大规模数学测评的目的越来越关注学生的发展性。这就要求大规模数学测评所得的数据不仅仅要满足计算及格率等的需要,而且要能科学、合理地解释学生学业水平情况,甚至要有助于研究者、政策制定者对多年来学生的学业情况进行比较研究,诊断教育系统的情况,进行科学决策。这也进一步要求在制定相应的测评框架时,在针对知识和技能中相关内容合理覆盖的同时,特别要注意体现学科内容领域的认知水平,体现过程中的能力方法,并促进量表的形成。显然,目前国内大规模数学测评框架制定中很少注意这方面工作的实际要求。

在新一轮国内数学课程标准的制定过程中,我们需要密切关注对数学核心素养的重新表述。 目前中国对数学素养界定为:“数学核心素养是具有数学基本特征、适应个人终身发展和社会发展需要的必备人格与关键能力,是数学课程目标的集中体现。”[2]此次对数学素养的界定,更加明确了在终身发展理念下数学素养的定位,这与PISA测评中对数学素养的认识基础是一致的。我们必须对课程标准,特别是初中数学课程标准加以关注。因为这个理念的确定和调整,对整个中国初中大规模数学测评的目标分析框架会产生不可回避的影响。

2.框架制定需满足体现框架内容合理、测试系统完整的要求

PISA测评框架制定的过程中,保证了框架内容及要求的合理性,有利于保证测试系统的完整性。以数学框架的制定为例,就数学测评框架的内部构成而言,一是要围绕测评目的构成,二是需要大量的文献资料及理论支撑。无论是对数学素养的认识,还是将知识内容分成数量、空间和图形、变化和关系、不确定性和数据,以及数学过程、“数学化”的引入,还有数学能力的界定,都拥有强大的理论支撑。这保证了框架内部构成部分之间的逻辑关系是清晰、明确的,也保证了框架在理论层面的有效性和可靠性。从框架的制定过程来看,PISA团队将它放在整个测评系统中,通过命题来检验框架内容的可操作程度和有效性。这样做可以对框架内容及表现作适当修改,有利于框架从理论层面向操作层面延伸,增强了框架内容的实用性和可操作性,并顾及了结果的解释,保证了整个测评系统的完整性。

目前,中国大规模数学测评框架的内部构成是根据课程标准来制定的。在过程与方法维度上,如在数学课程标准中,对数学能力的界定和表述是抽象和概括的。这些能力的内在联系是什么样的?在测试过程中是否可以表现?如何表现?这一系列问题在研究层面值得进一步实证分析。在学生学业水平的体现上,特别是在过程维度能力水平的合理、科学体现上,尚需作进一步研究。

解决问题的能力包含运算能力、空间观念、逻辑推理能力、解决简单问题的能力。从测量学的角度来看,这为模型的拟合带来很大困难,也极大地影响了测试的效度。虽然目前中国的大规模数学测评在问题解决的考查上,试题设计呈现出巧设问题情境、挖掘数学内部逻辑关系、充分利用问题解决策略开放等特点,但对于问题解决却处于有意识但无技术规范的状态。[3]

3.测评框架中内容及目标的可操作程度是框架制定过程的重心

测评框架的可操作性,必须以框架的有效性为基础。 目前中国很多大规模数学测评,如各地的中考数学测评,其框架的建立是依据课程标准,确立知识与技能、过程与方法的两维结构。但是由于课程标准过于抽象概括,而知识与技能、过程与方法中的相关内容应更具有可操作性,特别在命题层面尤为重要,这有助于试题设计,并能充分体现出不同的认知水平要求,因此是一个非常困难且技术含量非常高的工作。如果纯粹依据课程标准编制试题,试题的测评目标及认知要求往往会根据命题教师的理解而呈现,具有一定的随意性,容易造成整个测评的效度大打折扣。

在国际大规模数学测评的目标分析框架制定过程中,存在一个普遍的步骤,即通过试题的编制,不断对试题的认知要求及特征进行分解,获得试题的具体能力要求和认知特点,以保证与框架相应内容及水平要求的一致,同时可以借此进一步细化框架中相应内容的界定或水平描述。这种动态的力求互相切合的过程,对测评框架的完善是十分重要的。对中国大规模数学测评来说,保证测评框架的可操作需要是一个必不可少的实证过程。

4.测量模型的使用是框架制定的必要手段

在国际大规模数学测评框架的制定过程中,无论是内容领域,还是过程和表现期望方面,必须要考虑结果解释和报告形成。这也隐含了框架中所体现的结构特征要在结果解释或报告中得到真实的体现。这里需要使用定性的分析技术,也需要通过测量模型对测试所得数据进行拟合分析。这些在目前的中国大规模数学测评中正在引起重视。

评价是基于证据的推断,这个推断是基于统计意义上的推断。相关统计模型的综合运用,是评价结果获得科学、合理化解释的必要保障。如IRT中的相关测量模型在国际大规模数学测评中被广泛运用。该模型将试题的难度与学生能力的大小放在同一个刻度上,为试题与学生能力之间的关系在数量上建立了桥梁,为试题分析,更为框架的完善,提供了一个论证、完善的手段,将试题与学生能力建立联系,为框架的制定建立了很好的控制机制。这在中国大规模数学测评中,特别是高利害性考试的评价中尚需进一步应用。在中国,相应技术的推广及合理使用需要进一步深入研究。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈