首页 理论教育 教师自编成就测验的技术

教师自编成就测验的技术

时间:2023-02-20 理论教育 版权反馈
【摘要】:双向细目表指的是,以教材内容为纵轴,以教学目标为横轴,画出一个两维度的分类表,将分配好的试题比重或题数于表中的每个细目里,并尽量使试题的取材能够充分涵盖所要评价的教学目标和教材内容的范围,以作为编制成就测验试题的设计蓝图。典型的双向细目表示例见表10-3。测验由试题构成,试题质量的优劣是影响测验质量的重要因素。教师必须参照测验编制蓝图——双向细目表,在充分了解各类题型的优缺点和命题原则的基础上开始命题。

第二节 教师自编成就测验的技术

一、教师自编成就测验的步骤

(一)制订测验编制计划

1.确立测验的目标

美国教育学家布鲁姆(Bloom,1956)把教学目标分为三大领域:认知领域(Cognitive domain)、情感领域(Affective domain)、动作技能领域(Psychomotor domain)。一份测验若要能测量出学生的学习结果,老师就必须先要确立所要测量的教学目标是哪些。

(1)认知领域的教学目标

认知领域的教学目标是指有关知识或认知能力方面的学习结果。依据认知能力发展的顺序和学习的复杂程度来分,认知领域的目标依次分为下列六个层次:

知识(Knowledge),指最低层次的认知能力,包括名词、事实、定理和原理原则的记忆。

理解(Comprehension),指能够掌握所学过的知识或概念意义的能力。

应用(Application),指将所学到的方法、原理原则、概念等,应用到新情境,解决新问题的能力。

分析(Analysis),指将所学到的概念或原则,分析成各个构造部分,或找出各部分之间相互关系的能力。

综合(Synthesis),指将所学到的片断概念或知识、原理原则、事实等,综合、归纳或合并成一个新的整体的能力。

评价(Evaluation),指最高层次的认知能力,为依据某项标准进行价值判断的能力。

(2)情感领域的教学目标

情感领域的教学目标是指有关态度、兴趣、理想、欣赏和适应方式等情感能力的学习结果,该领域的教学目标由简单的、具体的、普遍性小的行为开始,逐渐发展到较复杂、较抽象、较普遍性的行为,依次可以分成下列五个层次:

接受(Receiving),为最低层次的情感能力,指对某些现象和刺激的接触、倾听、知觉、感受、体会和选择性注意的能力。

反应(Responding),指主动的注意、参与活动的积极、有作反应的意愿,和从参与活动中获得满足的能力。

评价(Valuing),指对接触到的事情、现象或行为感到有价值存在,进而表现出接纳、偏好、承诺和认同等积极的态度和追求其价值的能力。

重组(Organization),指分析有价值的活动内涵、归纳出推论的价值概念、建立起个人的内在化价值观念、发展个人的价值体系,并维持价值体系间的一致性和次序性等能力。

内化(Characterization by a value),指将价值体系内在化,使成为个性的一部分,个人并依据其内在化价值体系行事,并且做到表里一致的能力。

(3)动作技能领域的教学目标

动作技能领域的教学目标是指属于动作和技能方面的学习行为,包括:书写、打字、游泳、舞蹈、演奏、开车、跑步和操作仪器等需要用到的四肢与大脑协调的动作和技能性的学习结果。依据动作技能的发展层面来看,由简单到复杂的行为,依次可以分成下列六个层次:

感知(Perception),指用感觉器官去注意外在现象、刺激来源,或关系过程的能力。

准备(Set),指对上述感知到的动作或经验,在心理上、身体上和情绪上作预备适应的能力。

模仿(Imitation),指在有系统的教导下,开始学习、模仿,或尝试错误新的动作技能的能力。

自动化(Mechanism),指所学习到的动作技能经过模仿阶段,已达到非常熟练和正确的程度,不假思索即能作出反应的能力。

复杂反应(Complex overt response),指能够操作高难度和复杂度的反应,且其操作反应已达到高度效率和熟练程度的能力。

创作(Origination),指依据所习得的动作和技能,开始创新新动作和处理新技能的能力。

2.设计双向细目表

双向细目表(two-way specification table)指的是,以教材内容为纵轴,以教学目标为横轴,画出一个两维度的分类表,将分配好的试题比重或题数于表中的每个细目里,并尽量使试题的取材能够充分涵盖所要评价的教学目标和教材内容的范围,以作为编制成就测验试题的设计蓝图。典型的双向细目表示例见表10-3。

表10-3 小学数学四则运算测验的双向细目表

img22

img23

3.选定测验的题型

测验由试题构成,试题质量的优劣是影响测验质量的重要因素。不同的试题类型具有不同的特点,只有充分了解各类题型的特点,才能发挥各题型的作用构建出符合要求的测验。

试题的类型有很多种,一般来说,可以分成两大类:定向反应型试题(客观题)和自由反应型试题(主观题)。定向反应型试题只有唯一正确的答案,有时还提供了正确答案(如:选择题)。自由反应型试题由被试者提供答案,且答案不唯一。定向反应型试题主要有:填空、判断、选择(单选、多选)、匹配、排列、分类等;自由反应型试题主要有:简答、论述、计算、证明、名词解释、作文等。两类题型的功能不一样,表10-4列出了两类题型的功能比较。

表10-4 两类题型功能的比较

img24

(二)编拟试题的一般原则

教师必须参照测验编制蓝图——双向细目表,在充分了解各类题型的优缺点和命题原则的基础上开始命题。无论是何种题型,均应遵循如下共同的命制原则:

1.试题取材均匀,对欲测内容具有代表性。

2.试题的叙述力求简明扼要,题意明确。

3.各个试题宜彼此独立,要避免含有暗示答案的线索。

4.试题宜有公认的正确答案或相对较佳的答案。

5.试题中某些错误,虽不影响答案的选择,也应避免。

6.凡具有争议性的试题,应注明命题参考资料的来源。

7.若要测验学生的高层次认知能力,则试题不一定要有固定答案。

8.试题的叙述宜重新组织,避免照抄课文或原来教材。

9.试题应重视重要概念或原理的理解与应用,避免考核琐碎知识的记忆。

10.避免使用与测验无关的叙述,增加作答困难。

11.命题不要超出单元教学的评价目标。

12.提早命题,预留时间进行试题审查或修正。

13.多准备一些试题,以备不时之需。

(三)试题与测验的审查

教师命制的题目组成试卷之前,应对试题进行必要的审查,这可以分成两个方面来进行:逻辑的审查(Logical review)和实证的审查(Empirical review)。

1.逻辑的审查

以逻辑的方法审查测验试题,主要是审查测验试题是否具有一致性(Consistency)和适当性(Adequacy),以确保测验试题都能测量到所要测量的教学目标。

(1)测验的一致性。测验一致性的检验,就是检查试题与教学内容的叙述之间是否一致,其重点在于:①试题是否能代表所要测验的行为目标?②试题是否与教学目标一致?③试题是否与教学的呈现方式相一致?

(2)测验的适当性。测验适当性的检查重点,在于检查试题的格式、问题陈述的品质,以及其他可能的影响因素,是否能够确切地反映出试题所要测量的行为目标。主要包括:①试题内容、题数、范围是否遵照双向细目表的计划来实施。②试题类型是否遵循应有的命题原则来撰写。③题意表达是否清晰。④试题呈现方式与作答说明是否适当、明确。⑤试题是否具有对所要测量行为目标的代表性。⑥问题的叙述有无前后矛盾和提供暗示答案的线索或重叠出题等。

2.实证的审查

实证的审查是指通过对获得的测试数据进行量化分析,以判定试题品质的好坏。主要包括试题的难度和区分度分析,以及教学敏感度分析。难度和区分度的分析方法及标准参见前文。

较常用的教学敏感度的指标是前后差异系数(Pre-to-post difference index,简称PPDI):

PPDI=后测验的难度指标-前测验的难度指标

PPDI反映了试题内容是否对应了教学内容,正常情况下,PPDI应该介于0.10至0.60之间。

(四)测验的编辑

测验的编辑(Test editing)是指依据测验目的,将适合的优良试题编辑成一份完整的测验试卷。主要应考虑如下几点:

1.测验长度

一份测验究竟需要多少试题,并没有一个绝对的标准,一般而言,测验长度以中等能力学生能完成全部试题为宜。如下六个方面的因素,在确定测验长度时应予以考虑。

(1)测验的目的。一般而言,单元测验的试题数较整个学期或整个年度的学习结果的测验题数更少;形成性评价的测验题数较总结性评价的测验题数更多;标准参照测验的题数较常模参照测验的题数更多。

(2)试题的类型。在一定的作答时间限制内,客观测验的题数较主观测验的题数多。

(3)信度的高低。在其他条件相等的情况下,适当增加相同测验目标的试题题数,可提高测验的信度。

(4)学生的年龄。年龄越小的学生所适用的测验题数较年龄越大的学生所适用的测验题数应少。

(5)学生的能力。适用于能力较低学生的测验题数宜较适用于能力较高学生的测验题数少。

(6)作答的时限。速度测验的题数宜较难度测验的题数多。

2.试题的排列

教师可以采用下列三种排列方式之一或混合数种方式,来进行试题的排列。

(1)根据试题难度来排列。将简单的试题排列在前,较难的试题排列在后。这有利于:①吸引受试者的注意力,增加作答的信心,和维持继续作答的动机;②避免浪费时间于前面较难的试题,而错失后面较容易的试题。

(2)根据试题的题型来排列。将属于同类型的试题编排在一起,然后在同一题型中,再依据试题的难易顺序排列,简单的在前,难的在后。

(3)根据教学目标或测量能力来排列。即按认知目标的六个层次顺序来排列试题,或者是依据所要测量的能力来排列试题。例如,依据词汇、语法、阅读和写作等四种能力来编排英语成就测验试题。

3.编制测验指导语

测验指导语指的是印制在测验卷上的施测指导说明,这些说明应包括下列陈述:

(1)本次测验的目的。(2)作答时间多久。(3)是否必须列出计算过程。(4)说明不同试题的总分各是多少。(5)猜题是否扣分。(6)是否可以携带及使用教科书、讲义、笔记、尺、圆规、计算器等。(7)答题纸与试题册是否分开作答,分别交卷。(8)是否允许学生在答题纸或试题册上注释或补充说明事项。(9)考试中途是否可以举手提问等。

这些陈述只是为了统一施测的程序和步骤,让施测的过程达到标准化、一致化,避免因为施测程序不一,而影响学生的作答情绪和成绩。

二、常见题型的编制技术

(一)选择题的编制技术

1.选择题的结构

每个选择题都包括一个题干和一组选项。题干通常是一个疑问句或不完整的陈述句,选项通常有四个,其中只有一个正确答案或最佳答案。其他几个选项都为干扰项,对那些不能确定哪个选项是正确答案的学生来说,它们的主要作用就是干扰或诱答,所以也称为诱答项。

2.选择题的编制原则

(1)题干的编制。①题干应该意义完整,且明确地界定问题。②题干的用词要前后一致,要适合学生阅读能力水平。③题干中应尽量避免使用否定式叙述。④避免题目与题目之间相互提供作答线索。⑤避免以前一题答案作为下一题的基础。

(2)选项的编制。①每个选项之间应彼此互斥。②诱答必须具备似真性,或各选项之间要有同质性。③避免使正确答案显得特别长。④如果所有的选项都有共同的文字,应该把文字移到题干上。⑤要避免选项编号与选项内容相混淆。⑥尽量避免使用“以上都是”或“以上都不是”的答案。

(3)选项的排列。①正确答案应随机出现在各个选项位置上。②各个答案之间应尽量依据逻辑顺序排列。③选项的排列格式要一致、整齐。

3.诱答项的编写

编拟诱答项的原则就是要“似是而非”,让每一个诱答项具有似真性,这样一知半解的学生就不容易以排除法来猜中答案。

编制选择题时,教师可以依据个人教学经验预测学生可能出现的错误答案;也可以用简答题的形式先考一次,以便汇集学生各种可能的错误答案。此外,教师可以依据下列方向来构思诱答项:

(1)以错误的方式使用专门术语。

(2)由作业或口头问答中找出学生常见的错误概念。

(3)使用可算正确、并非重点的,而是旁支末节的答案。

(4)使用在同一单元上曾经用到的术语或新词汇。

(5)部分对,但因缺乏某要素使得其他选项显得更周延、正确。

(6)若更改部分题干就会变成正确答案的选项。

(二)判断题的编制技术

判断题是呈现一个陈述句,要求学生判断是对的还是错的。很多老师在编制这类题目时,常常是在教科书中找出一句话,对某个地方做一下改动,使之不正确。这样编制出来的题常常很糟糕。问题在于,首先,判断题陈述的常常是一些简单的事实性知识;其次,在大多数情况下,没有什么绝对正确或绝对错误,是依情况而定的。

编制判断题应注意如下原则:

1.题目应避免直抄课文或断章取义。

2.若是要考对因果关系的了解,应该使前句和后句都是正确的,至于两者的关系则可以是对或错。

3.除非是在考因果关系,否则同一个题目中不可含有两种概念。

4.避免使用一些限定性词语,如:所有、有些、有时、可能、只有,等等。

5.避免使用否定句,尤其是双重否定的句子。

6.避免答案为“对”的试题的叙述总是比答案为“错”的长。

7.答案为“对”或“错”的试题题数相当,答案不可作规则性排列。

8.叙述要明确,使各专家都能得到一致的答案。

9.切忌故意出诱人上当的题目,例如在关键字上出现错字。

(三)填空题的编制技术

填空题是给出一个缺少某个成分的陈述句,要求学生通过填写缺少的信息来补全这个陈述句。教师常常认为这类题很好命制,而忽视命制填空题时可能出现的问题。填空题常常只设计一个正确答案,而实际上却可能存在几种并没有考虑到的潜在的正确答案。在这种情况下,如果学生给出了一个并非教师设定的,但同样也是正确的答案,他很可能会被不公正地判成是错误的。为了提高填空题的编制质量,应注意如下原则:

1.试题当中的每一个空格只能包含一个要点,如果要考察几个要点,就需要提供几个空格。

2.试题中的空格数量不能太多,也不能在一个陈述句中抽掉太多的关键部分,这样会导致试题难以读懂。

3.保证所有的空格长度一致。这样,空格的长度就不会为学生猜测提供线索。

4.所要填写的必须是重要的概念,而非毫无关联的零碎知识。

5.各题待填的空格,宜尽可能放置在末端或集中在最前面,以方便计分和容易把握题意。

6.如果是使用数字型的答案,则应清楚标明所要求答案的精确度。

(四)简答题的编制技术

简答题主要用来测量一些较低水平的技能,其设计思路与填空题十分相似,都是要求学生写出具体的重要字词、数字或符号等。只是简答题的题目一定是完整的问句,答案可以包含多个关键词,而填空题的题目通常是不完整的叙述句。简答题的编制要求参见填空题的编制技术。

(五)论述题的编制技术

论述题最适合测量客观性试题所无法测量的那些高水平、复杂的技能。与客观性测验相比,优秀的论述题,会促使学生更加深入地探究学习。论述题不仅需要回忆有关的信息,而且要对这些信息进行积极的加工和重新组织,然后用一种逻辑严密、前后一致的方式论证自己的观点,表达自己的想法。学生无法依靠猜测来回答这类问题。尽管学生有可能会阐述一种一般性的观点,但他们无法轻易地掩藏自己某些不完善的知识和对教学内容片面甚至错误的理解,并且学生的回答也会体现出思考的深度和新颖性。

在编制论述题时,应遵循如下原则:

1.问题所涉及的应该是那些重要的概念,而非细枝末节。

2.问题应该使学生运用或重新组织课堂或书本上所学的知识,而非简单地报告一些事实。

3.问题既要具体而明确,避免大而宽泛、含糊不清,同时又要给学生足够的空间来展示他们的知识和技能。

4.事先要设定评分标准,并让学生了解这些规则,知道教师在评分时重点考察哪些方面。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈