首页 理论教育 国外中学数学教育评价简介

国外中学数学教育评价简介

时间:2022-03-12 理论教育 版权反馈
【摘要】:认为应该将学生的学习作为评价对象,即将学生与教师、其他学生、书本以及其他教育资源的交互过程作为评价对象,要凸现评价对学生实际学习的促进作用,提倡形成性评价的应用。因此在英国,现在是多种评价方式共存的状况。英国以法定形式建立了“国家课程”,逐步建立了“国家评价体系”。在这种国家评价中,形成性评价与全国标准化测试初步结合起来。形成性评价主要指在英格兰和威尔士进行的数学阶段评价活动。

一、英国基础教育中数学评价特点简介

20世纪90年代以前,英国的基础教育中学生评价主要以测量评价为主,以一种绝对的方式去测量学生已有的成绩和潜力。从评价性质看,终结性评价占主导,关注学生已经生成的能力、技能以及掌握的知识,通过评价来刻画学生的“真实水平”与课程目标之间的差距。从评价目的上看,主要是区分,在学生之间划分等级,学校之间优胜劣汰,政府通过拨款控制教育按其意图进行发展。因此,可以说实行的是一种精英教育。

1997年布莱尔上台后,在教育领域中主张让每一所学校成功,让每一位儿童成功。因此,学生评价不再只关注学生的学习成绩,对学习风格、学习动机、价值观等非智力因素更加关注。认为应该将学生的学习作为评价对象,即将学生与教师、其他学生、书本以及其他教育资源的交互过程作为评价对象,要凸现评价对学生实际学习的促进作用,提倡形成性评价的应用。形成性评价注重过程,通过对学习过程中学生具体生动的活动的评价来改善活动,可以使学生的学习更积极有效。但绝大多数的家长还是信奉日趋完备的测量评价范式得出的结果。因此在英国,现在是多种评价方式共存的状况。

英国的基础教育中学生评价采用三级框架体系:最上一级是国家考试,采用国家统一的标准级别,它的作用是保证教育质量;中间一级是教师所实施的评价,在每个学习阶段结束时实行,以保证学生不偏离学习计划;最下一级是学生的自我评价和同学间的相互评价,在教育任何情境中都能发生,这种评价是“为了学习的评价”,渗透于教学与学习的各个环节,师生一起分析细化学习目标及标准,及时反馈,使每个学生都可以得到发展。资格与课程局于2000年4月发表了《教师对形成性评价的报告》,强调了形成性评价在新课程评价中应用的地位,告诫教师要摆正自己在学生评价中的位置、角色,以推动新课程顺利实施。尽管如此,英国还是以终结性评价、测量范式为主。

英国以法定形式建立了“国家课程”,逐步建立了“国家评价体系”。国家课程规定了10个水平,每个水平代表中等程度学生每两年的提高情况,水平1大致代表5岁学生的平均成绩,水平6为15岁学生的平均程度,水平10为16岁学生中最好的2%~3%的学生水平。所有学生都要在四个关键阶段(7、11、14、16岁)参加全国性考试,以这10个水平为目标参照水平。全国性评价的结果按各个学科进行公布,每个学生分学科按各级学业目标定出达到某一水平。数学有五个学业目标:过程方面是数学应用;内容方面包括数、代数、图形与空间、数据处理。在这种国家评价中,形成性评价与全国标准化测试初步结合起来。教师要根据自己对学生的评价决定学生参加高一级或低一级的水平测试。

形成性评价主要指在英格兰和威尔士进行的数学阶段评价活动。数学阶段评价有一系列标准,形成了学业的逐级水平,采用目标参照模式,以认知策略为基础,不再是技能、技巧的测评。学生参加常规的笔试,在运用算术、解释数据、应用空间技能、解释三维图像等每一方面需要答对至少80%的题,若达不到这个目标,那么要进一步学习后,再参加一次平行考试。除笔试外,还在每个阶段参加一对一的、书面的、口头的、实践的测验,以及心算的、估算的测验,学生们也可以做拓广的时间较长的专题作业。每一阶段结束时,学生们会获得一张证书,上面写明他们取得的进步。这种评价,在技术方法上强调开放性的活动(包括问题解决、纯数学及应用数学方面的调查、研究课题等),并总结了应用的标准。这种评价方式还包括经教师审核的学生自我评价、观察、讨论,以及许多通常的课堂作业和测验。这种评价方式使教师的专业特征增强,越来越了解其所教的数学的本质和学生个人的成绩和弱点,形成了更适应学生需要的各项课程内容。不同学校的教师要定期开会交流,从而加速自身专业发展。学生也深入到自己的评价和学习中,他们本人同样能参照标准,认清自己已有的基础及必须达到的下一级水平,学习动力迅速增强。学校则发现他们学生的“普通中等教育证书”的成绩得到提高。

Cockcroft报告将联系实际的数学和问题解决确定为数学教学的六项必修内容中的两项。该报告指出:“只有限定时间的书面考试,不能评价心算能力或讨论数学的能力,也不能评价韧性和创造性品质。”因此对“普通中等教育证书”考试进行了改革,规定设立口试题、联系实际的题目,以及由教师评价的附加的调查性小课题。心算和口头测试已进入班级考试体系,有时还采用个别交谈形式,甚至鼓励采取小组活动的形式进行附加题测试,这为评价学生在讨论中的表现提供了机会。

英国的笔试评价有自己的一些特点:

①强调问题背景,将数学隐含在学生觉得具体而有意义的背景中,这在心理学中有重要意义,但要发现并使用既适合考生,又能很快被其理解的背景不太容易,因此,在命题时发动了一批教师,集思广益。

②使用区别对待的考卷。Cockcroft报告采用了一组考纲一组考卷的形式,按深度和难度的增加排成系列,学生可自愿选择。

③使用理解性考卷,即考生阅读数学文章,然后回答问题,这些问题考察他们对数学的理解,有的要求他们推广或提出更进一步的观点。这种形式不是要把学生圈在考纲内容上,旨在开放数学学习,增进学生动脑筋阅读数学的能力,开阔数学视野。

对于笔试中不适合评价的技能和过程,英国采用大型作业题形式测评,对每一种形式的题目它们的评价过程是不同的。其中题型及其评价过程主要有以下几种形式:

(1)开放题

开放题又可以分为:

①实际的或应用的题,要求学生将数学应用于现实生活问题。例:买东西,“你们家在哪里买食品?这个决定明智吗?”

其评价过程包括:辨识——分析,计划;实施——建立模型,试验/发向,取样/收集,测量,处理数据,表达,检验/优化;回顾——形成一种解答,交流,解释,修改。

②研究题,要求学生从本质上探究数学的问题。例:增长的菱形,“在这个图形中有几个菱形?研究下图”。

其评价过程包括:辨识——发问/推广,计划,开始/化简;实施——系统地工作,分类,符号化/记录,猜商量/一般化,检验/证明;回顾——小结,交流,推广。

(2)心算测验题

在英国笔试中,计算器是随便使用的,因此“普通中等教育证书”教学大纲中设有一些心算测验,测试估计、空间想象,甚至是代数。例:估计100°的正弦值。

众所周知,讨论是数学活动中必不可少的一部分,因此把“交流”定为评价标准之一。采取有书面材料的访谈方式受到广大师生的欢迎,但花费时间过长,大多学校行不通,而且口头评价不易于标准化,特别是与学生讨论时要作出正确评价很难做到。

二、澳大利亚中学数学教育评价最新发展

(一)昆士兰州中学的两套评价系统

在此,我们仅从澳大利亚昆士兰州中学评价系统中概览澳大利亚的教育评价情况。

昆士兰州中学有两套评价系统。

1.校本评价系统

校本评价系统是一种内部的、单课程的、以校为本的评价系统,其目的是为了证实学生的成绩确实符合教学大纲所规定掌握的知识能力要求,它又包括:

①目标参照性评价,它强调是否达到已定标准,由终结性评价及形成性评价组成。

②毕业评价,它是学校根据学生的知识和对课程原理及概念的理解程度以及学生在各种环境中的思维分析及操作能力进行过程而作出的决定一个学生最终学习成就水平的评价。

2.跨课程考试评价系统(QCS考试)

QCS考试是由昆士兰州管理集中举行的全州性标准化考试(即反映在中学课程的能力基本要素),测试题是跨课程的综合性题目,其内容在极大部分学生的经验积累范围内,测试题较丰富,其水平适合于毕业年级学生应试者。考试由四套试卷、三种题型(多向选择、简答、扩写)组成。

(二)澳大利亚中学数学教育评价的一些新成果

1.数学教育评价中面谈法的运用

澳大利亚凯思里克大学(Catholic)的克拉克(Clarke)博士近年来研究了用面谈的方式评价学生在数学学习上的表现。他研究的重点是通过与学生单独的面对面地访谈来了解学生面对具体问题时的表现,进而了解学生解决问题的思考过程,评价学生不同的思考方法,分析教师对学生的理解与认识,以期认识教师对学生以及学生学习数学的理解。

下面通过一个例子展示面谈法的具体运用:

案例1餐馆的座位

问题1在一家餐馆里,餐桌都是能坐4人的方桌。当客人多于4个人时,餐馆老板就把桌子摆成一条线拼在一起,那么2张桌子拼在一起能坐6人。3张桌子拼在一起能坐几个人?(若学生能回答出8,则问如何得出;若回答不出,则让学生独立画图得出)

问题2完成下表及问题。拼成一行的桌子123410…n人数461824…m

(1)已知桌子数,你能快速算出一共能坐多少人吗?

①用语句和图表达你的方法以便别人能理解。

②用数学符号表达这个关系。

(2)已知要坐的人数时,你将必须算出需要多少张桌子。(当有人向餐馆订餐时这种情况经常发生)

①如果你被告知订餐的人要坐在一张桌子上(只考虑恰好坐满的情况),怎样算出需要多少张桌子?用语句和图解释你的方法。

②用数学符号表达这个关系。

(一个学生的高水平的反应是对初始情境和相反情境用符号形式表达出来,表格答案如下:桌子数123410811n(m—2)/2人数468102218242n+2m

用符号形式表达如下:

m=n×2+2(m-2)/2=n

若学生能得此答案,请他说出思考过程。

教师也发现,即使一些学生能在(1)题中得出一个一般规律,但他们在用符号表达第(2)题时可能会出现混淆现象。如下例

(1)n×2+2

(2)m/2=8—2=n

若发生这种情况,教师首先问学生为什么得出此结果,然后让学生对照表格验证答案,进而修改。)

教师们一致认为,通过从面谈中获得的资源,可以展示学生对于数学理解的程度,如果没有这种一对一的范围较广的互动的特殊机会,那是不可能达到的。教师有如下发现:

①一些学生的表现要好于教师对他们在正规教学计划中的第一印象,一对一的情境和等待的时间使他们有机会去展示他们所知道的事情。

②可以发现一些在常规教学中很难发现的学生的缺点。

③对于那些平时比较沉默的学生(尤其是女孩),一对一的交往和真正的交谈使教师能更深入地了解他们以及他们怎样去思考。

④学生在面谈中表现出愉悦与自信。无论他们在什么水平上进行数学运算,他们都可以完全享受与教师共有的时间、感受和机会。他们非常喜欢表现他们所能做的,喜欢数学、盼望数学、经历某一水平的成功。

同时,面谈法对教师教学也有以下促进作用:

①更注重数学概念之间的联系以及把课堂数学应用于实际生活。

②更多使用开放题,为学生提供更大的挑战。

③更少强调规范的记录和规则,允许各种记录方式。

④基于任务(task)的评价法。

这种评价方法的内涵是:通过让学生完成各种具体丰富的任务,在学生完成任务过程中,可考查学生多方面的表现。这种方法在问题的性质、评价方式以及对评价的具体操作等方面不同于传统的纸笔测验方式。

这一评价方法的核心就是:选择和运用可操作性更强、更有评价特征的数学任务。因此,任务的选择至关重要。这些评价任务应该与教学内容联系紧密,一般一项任务可产生多种结果,可为学生提供一系列应答的机会,它需要有充足的时间来完成并利于教师管理,能使所有学生都可从头直接参与,其解决方法多样,并且这种评价任务要使教师和学生关注各种数学活动,允许学生说明他们能够将所学概念建立起联系,以利于学生从老师那里得到必要的帮助。

2.数学教育评价中基于任务的评价与运用

基于任务的评价法更加关注学生学习数学过程中的特殊表现。在学生完成一项具体任务时可表现出对数学的兴趣、数学知识与技能以及思维创造的能力,因为这些活动与学生的生活或现实生活有密切联系,使学生增加对数学学习的主动性,使学生更有效地学到有关内容和方法。与此同时,通过这种评价法,也可使教师从多角度了解学生数学学习的表现,对其表现作多方面的判断,包括其思维活动、对有关数学内容的理解掌握程度、数学创造能力、数学学习活动的参与程度以及对数学的情感和态度,从而更全面地评价学生的数学学习。

下面是评价任务的具体例子:

案例2电话本中的姓名

(1)评估活动说明

目的:引导学生估计,并学会估计大集合中数字个数的方法。尽管关注点在于估计和描述,但在学生的活动中也明显反映出对其他评估活动反应的方面,如列式计算、数列及数的关系等。

提供给学生只有格林名字的卷子。可以先进行一下初步的班级讨论以确定进行估计活动时什么方法是可接受的,什么方法是不可接受的。

(2)评估指导

尽管这项活动是关于估计的,也不要仅仅基于估计的准确性考察学生的反应,更重要的是学生用于估计和计算的策略,以及他们能从估计中得出什么结论。这一水平上的学生不能数出所有名字,但可以通过数一列或一列的一部分而得出一个大约的数字。

一个高水平的反应将清晰、有效地展示每一步计算中的策略,并根据最初估计的准确性得出结论。例如,在看完一页电话簿后:

一名学生可能估计出一列中所有名字的数目(假设是100);

假设每页有4列,则可估计每页总共有400个名字;

则估计一本总共有16×400个名字;

再按每个名字拨8个数字键计算,则可计算出拨打所有名字应按电话键的数目。

(3)建议可深化该活动

作为一项附加活动,学生可以估计有多少他们自己姓名的电话号码,甚至可以在班级画一张图,为学生创造处理大数字的机会。

(4)具体题目:电话本中的姓名

第一步:估计。

不要用任何铅笔和纸进行计算而估计下列各题的答案,一旦写下答案,不要改。

①麦尔伯恩的电话本中有16页是姓格林的。请估计一下电话本中能有多少位姓格林的(商业名字也计算在内)?你为什么这样估计?

②如果你打电话给这些格林,一共需要按多少个数字键?假设你第一次就接通了每个人的电话。

第二步:计算。

计算下面各题答案:

①在合理的精确度内计算在麦尔伯恩的电话本中有多少位姓格林的?弄清楚你是怎样得出答案的。

②如果给这些格林打电话,在合理的精确度内计算出应按下多少个数字键?假设你第一次就接通了每个人的电话,弄清楚你是怎样得出答案的。

你对自己的估计有什么评论?

案例3分割三角形

(1)评估任务说明

目的:展开先是整数然后是分数的面积的几何规则,并把这一规则表述为一般规律。这项数学活动的妙处在于把算术的一些方面(特别是表述一般规律和运算)与几何和面积相结合。

(2)评估指导

完成这项数学活动将包括在极小错误率下得出答案并进行推理,对1—4题的应答如下:

②有以下数目的三角形被移走了。

a.在第3步后:4个三角形

b.在第4步后:13个三角形

③阴影部分的面积如下:

a.第2步:3/4

b.第3步:9/16

c.第4步:27/64

④规律从27/64持续到81/256,然后到243/1024,学生的推理可以有许多形式,如:

随着每前进一步,分子被3乘,而分母被4乘。这是因为每个三角形都被分成4个三角形(分母),并且每次3/4都是被划为阴影。

一个学生可产生出阴影部分面积的规则,如:

3n—1/4n—1或(3/4)n—1

这超越了本项评估活动的要求。

(3)具体题目:分割三角形

在上面的模式中,你能看到每一步每个带阴影的三角形被分成四个面积相等的三角形,并且中间的那个被移走。

①画出第4步的图形。

②在第?步后有多少三角形被移走?

a第3步?b第4步?

③假设在第1步中阴影三角形的面积为单位1,写出下列各步中阴影部分的面积:

a第2步b第3步c第4步

④不要画图,预测第6步所有阴影部分的面积,简要说明你推导出答案的过程。

⑤得出一个求任何一步中所有阴影部分面积的一般规则。

具体的评估标准:具体评估标准

评分表现(可用于以下领域内容的评价:几何、数、测量、概率与统计、代数)等价的过程优秀此水平学生要全部完成任务,但要用几种方法,对解答做出解释,或说明由此任务引出的深入的和普遍的意义除完成要求的任务外,还表现出明确的解题策略、数学交流和推理能力4分能完成任务,清晰地证明和理解核心的数学概念提出合适的计划,应用适当的策略与数学方法,进行清晰的交流3分对完成任务有明显的进展,表现出对相关知识、概念和技能的理解,但一些关键概念可能混淆有合理的计划,能运用解题策略和数学知识进行交流2分试图使活动有进展,部分且有限地掌握有关的核心的数学概念,对知识的掌握、概念的理解和有关技能的运用不熟练缺少有效的解题策略和进行交流和推理的能力1分缺乏对问题的理解和解题过程运用的策略无效,缺乏交流和推理的能力

通过以上对面谈法和基于任务的评价法的介绍,可看到当今澳大利亚中学数学教育评价运用了一些较新的方法形式,这些评价形式更加客观、公正、深入,密切联系学生现实生活,容易调动学生积极性,缓解学生解题的紧张感,让学生在充满兴趣的轻松状态下投入数学问题的解决过程,并利用它们形成一种习惯,即利用所学知识解决实际问题。从另一方面来说,它也促进学生从生活中发现数学问题。同时,这些评价形式需要学生直接参与。在学生完成任务过程中,教师可以得到一种过程性的评价,以及对学生的表现性评价,而不仅局限在通过笔试结果片面评价学生。教师可根据学生在此过程中的表现去理解学生思维过程,发现他们的问题所在并给予特定的帮助。这种评价活动的设计对我们当前的数学教育评价工作是很有借鉴意义的。

三、丹麦中学数学评价

(一)两级式的中学高段教学

丹麦的学制分为两部分:义务教育(9—10年)和中学高段教育(3年),他们在管理和教师配备上都是独立的。中学高段的教学又分为数学和语文两个方向,主修语文的可以不学数学(以一门包括一部分数学内容的自然科学课程代替)。本文主要讨论的是数学方向的教学评价。

丹麦中学高段的数学教学的一大特点是实行两级式的教学,由A、B两个水平组成,学完前两年数学课(每周5节,每节45分钟),即达到B水平。在B水平的基础上,再学完第三年,就达到了A水平。A水平的学生占B水平学生的80%。

(二)教学内容

中学高段数学教学内容。丹麦中学高段数学教学内容

等级

教学内容B水平A水平纯数学专题前两年数论、函数、统计、几何、概率等第三年无向量理论、与计算机有关数学等其他三个专题数学史模型和建模数学内部结构

(三)评价

在丹麦的中学数学评价系统中,除了传统的笔试方式外,还有口试和大型书面报告两种方式,下面依次详细介绍:

1.笔试

对于A、B水平的学生,都需要参加由教育部组织的终结考试。笔试内容有纯数学题、应用题和简单的建模问题,分为必答和选答两部分。B水平有25%的题目比较简单,其他部分则要难一些。较难的题目涉及数学原理及实际应用,但是并不要求学生自己将问题数学化(除较简单的如线性或指数增长及求函数表达式外)。下面是B水平笔试中较难的题目:

例9.9一家工厂在排放的废水中有一种含磷的化合物。在两年中对废水进行检查,结果其磷化物的日排放量平均值为0.53千克,标准差为0.20千克。

问题1:求这期间磷化物日排放量超过0.7千克的概率。

问题2:估算出排放量最低的10%天数中磷化物的总排放量。

工厂加强了废水处理,于是在第二年年底,磷化物的日排放量平均值为0.41千克,而日排放量超过0.70千克的概率降到了2%。

问题3:求第二年年底磷化物日排放量的标准差。

例9.10问题:函数f定义为

3x2+2x—6x+2

求f的定义域、零点、符号和单调性。

问题1:求函数图像的渐近线。

问题2:画出f的图像,求f的值的集合。

教师主要依据学生计算方法的正确性和思考方式的清晰程度批阅试卷,考试分数为十分制。

2.口试

对于B水平的终结考试,达到B水平而不准备达到A水平的学生,除参加笔试外,还要进行一次口试;而A水平的终结考试也包括一部分班级的口试。

口试目的:检查学生有关数学课题的基本知识和对数学专题关键部分的解释能力,让学生在数学概念和思考方法的理解方面比笔试有更多的表现机会。

口试范围:B水平涉及大纲一半内容,至少包括上表列出的“其他三个专题”中的一个专题,A水平涉及大纲三分之二内容。

试题分为两个部分:第一部分说明考试课题的标题,第二部分要求学生独立完成对该课题不同方面的详细说明。B水平考试分为两部分:有一部分是检查学生基本知识的师生之间的谈话,而A水平则要求学生独立表述出他具有的基本知识。下面是几个例子:

例9.11(B水平)增长模型

问题:详细表示指数增长的模型,包括它的表达式和图像。(可以利用下列数据)

1963-1970年间,丹麦女工每小时工资数(丹麦克朗)为:年份196319641965…每小时工资5.976.617.43…

在适宜的环境中,大肠杆菌细胞每20分钟分裂一次。时间(分)020406080…细菌数100020004000800016000…

在口试中,要求学生独立说明:

①在现实生活中,哪些增长可能是指数增长?为什么?

②为什么说f(x)=bax表示的增长的百分比是不变的?

③为什么f(x)=bax的图像等价于半对数坐标系中的一条直线?

④为什么倍值周期是一个很有意义的概念?

⑤为什么T2=log2/loga?

3.大型书面报告

在第三年中,每个学生都要就自己所学的某一课程写一篇大型书面报告。写这种报告的目的是为了让学生表现出他们学习数学的能力和将所学的知识写成书面报告的能力。题目可在纯数学专题或其他三个专题方面选择,例如:与数有关历史、巴比伦人的数系、混沌与分形等。这种报告由教师和一名外来考试人员批阅,并按十分制评分。

这三种评价方式均由校内教师及外来考试人员(一般由外校教师担任)共同执行,其中校内教师执行校内评价,外来考试人员执行外来评价。评价学生能力的分数为十分制,不同评价形式和它们与课程主要部分之间的关系:不同评价形式与课程主要部分之间的关系

过程

内容笔试口试校内评价外来评价校内评价外来评价主要专题练习

问题解决中的理解和技巧应用方法

问题解决中的技巧说明:

结论

证明

数学专题理解:

思考方式

数学专题续表

过程

内容笔试口试校内评价外来评价校内评价外来评价其他专题数学史例如小论文(如:黄金分割问题)小型演讲,如:巴比伦人的数系例如:“古希腊数学”模型和建模例如小型研究报告(如:放射性的衰变)应用已知的模型

建立简单的模型小型演讲(如:什么是数学模型)建立模型的过程

数学模型的应用数学内部结构例如小论文(如:勾股定理)说明……例如:说明“证明的类型”概念

数学思想

证明

在丹麦的数学教育评价中,体现了一种注重表达——口头及书面的理念,给我们留下了十分深刻的印象,也值得我们在评价改革中借鉴参考。

复习思考题

1.什么是教学评价?结合实际,谈谈教学评价具有哪些功能?

2.怎样理解数学教学评价的意义与作用?

3.如何正确理解数学课堂教学评价的内容?

4.假如你拿到一个班级的学生数学成绩,你是如何评价班级学生的学习成绩的,谈谈你的想法。

5.有一个年轻教师,对第一次公开课的备课很认真,他征求了很多老教师的意见,却听到了不同的意见,他拿不定主意,对这个现象,请谈谈你的见解。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈