首页 理论教育 对能力缺陷的学生和英语学习者的评估

对能力缺陷的学生和英语学习者的评估

时间:2022-02-27 理论教育 版权反馈
【摘要】:然而,多亏颁布了两部意义深远的联邦法律,今天教师至少需要了解联邦法律是如何规定对能力缺陷学生和英语学习者进行评价的。《所有残疾儿童教育法》的制定者们相信该法案将帮助能力缺陷儿童接受教育,尽可能地使他们接受正规的课堂教育。《残疾人教育法》规定,所有的州和学区的教育评估计划都要包含对能力缺陷儿童的评估,并且要公开评估的结果。但是,对于有严重认知能力缺陷的儿童,可以使用不同的成就定义。

教师评价两类独特的学生时,评价偏差会以难以预见的形式出现。这两类学生指的是:能力缺陷的学生以及英语学习者。在过去,主要由教育专家指导这两类学生,而不是由普通教师进行指导,因此教师基本不会注意到针对这两类学生的测验。然而,多亏颁布了两部意义深远的联邦法律,今天教师至少需要了解联邦法律是如何规定对能力缺陷学生和英语学习者进行评价的。我们将简单看一下与这两类学生相关的潜在性评价偏差。

听到“能力缺陷儿童”一词,许多教师就会立刻想到那些弱智儿童,他们被委婉地叫作受“特殊教育”的学生。其实这种观念是不准确的。实际上,只有10%的能力缺陷儿童是弱智。三分之二的能力缺陷儿童,要么具有某一具体的学习障碍(几乎80%的学生的学习障碍源于阅读问题),要么是由于语言或语音的损伤。在联邦法律中,有13类能力缺陷的规定,包括一些不经常发生的能力缺陷,如孤独症(约占2%)、情绪困扰(约占8%)以及听力受损(约占1%)。

对于如何教以及如何测试能力缺陷儿童,政府已经颁发了诸多联邦法案。1975年颁布的《所有残疾儿童教育法》(即94-142公法)是基于以下几点原因:①对残疾儿童也需要恰当的教育这一认识的提高;②一系列司法裁决要求,如果向正常儿童提供教育的话,也应为能力缺陷儿童提供合适的教育。这一法案通常被简称为“94-142公法”(P.L.94-142)。该法规定,如果某个州不能为能力缺陷儿童提供恰当的教育,联邦政府就不会拨款给这个州。

《所有残疾儿童教育法》还规定,对能力缺陷儿童使用“个性化教育计划”(individualized education program)。“个性化教育计划”是由家长、教师、特殊服务提供者(例如听力)共同开发的,它描述了该如何对有能力缺陷的特殊儿童进行教育。一份“个性化教育计划”就是一份儿童教育计划,它阐明了该儿童要达到的年度目标,指出了该如何确定儿童要获得的目标,指定了儿童需要哪些相关的服务,规定了在儿童的评估中需要进行哪些调整或替换。《所有残疾儿童教育法》的制定者们相信该法案将帮助能力缺陷儿童接受教育,尽可能地使他们接受正规的课堂教育。

1997年,对《所有残疾儿童教育法》进行了修订,同时,被冠以《残疾人教育法》的名字,缩写为“IDEA”。这一修订要求州和学区确定特殊教育学生的课程目标,并尽量与已经确立的正常学生的课程目标保持一致。《残疾人教育法》规定,所有的州和学区的教育评估计划都要包含对能力缺陷儿童的评估,并且要公开评估的结果。但是,由于1997年的《残疾人教育法》包含了少量对不合格学生的负面影响,因此大部分教育工作者未能遵守这一法案。

2002年8月布什政府颁布了《不让一个孩子掉队》法案后,美国特殊教育界发生了重大的改变。与1997年的《残疾人教育法》不同,《不让一个孩子掉队》(NCLB)增加了对不合格者的惩罚。本法案旨在提高所有学生的学业成就水平(也包括能力欠缺儿童),这些进步将出现在国家选择的与每个州的课程目标相关的测验中。为了充分地反映出学生学习的进步,学生的测验成绩必须有定期的提高。即使NCLB法案允许各州在确定参加测验的学生中获得“精通或更高”成绩的学生的数量时,可以有一定的弹性,但是如果一所学校未能完成规定的“适当的年度进步”(adequate yearly progress)(AYP),那么这所学校就会被列入改进的计划中。

更重要的是,NCLB不仅要求全体学生取得“适当的年度进步”,还要求亚群体成员也取得适当的年度进步,这些亚群体成员包括:种族群体、经济劣势群体、英语不熟练的学生以及能力欠缺的学生。因此,如果某所学校中包含了任何亚群体中的大量学生,其中某一个学生的成绩未能达到该亚群体“适当年度进步”的目标,那么整所学校就没有完成“适度年度进步”的目标。显然,与之前颁布的法案相比,NCLB使学校的教育者更加重视能力缺陷儿童在评价中的表现。

2004年,《残疾人教育法》(IDEA)再次被修订。然而,这时已经颁布了另外一部评价能力缺陷儿童的重要的联邦法规——《不让一个孩子掉队》法案(NCLB)。联邦法律的制定者试图塑造新修订的IDEA,以便尽可能与两年前颁布的NCLB法案的评价规定相一致。即便如此,IDEA和NCLB之间仍有一些重要的差异。记住,当《所有残疾儿童教育法》进入教育领域时,它最有影响的贡献之一就是“个性化教育计划”(IEP)。《残疾人教育法》直接关注教学和评价的个性化,许多教师把它看成一份名副其实的能力缺陷儿童的个性化教育计划。

与《残疾人教育法》(IDEA)中为每位能力缺陷儿童量身定制的方法不同,《不让一个孩子掉队》中的问责制策略更具群体基础(group-bases)以及亚群体基础(subgroup-bases)。“《残疾人教育法》和《不让一个孩子掉队》法案都致力于保证在评估和问责制系统中要包含能力缺陷儿童。然而,《残疾人教育法》主要关注儿童个体的需要,《不让一个孩子掉队》法案则主要关注如何确保提高所有儿童的学习成绩。”(1)

对于教育和评价有能力缺陷的儿童,教师最需要知道:在这些有能力缺陷的学生中,对于其中的一小部分学生,教师给予的课程目标应与所有儿童的课程目标相同。《残疾人教育法》和《不让一个孩子掉队》法案都要求为所有的学生提供相同的内容标准,不允许有例外。但是,对于有严重认知能力缺陷的儿童,可以使用不同的成就定义。因此,这一小部分有严重认知缺陷的学生可以使用修改过的测验展示自己在相同内容标准上的表现,所采用的修改后的方法主要是代替性评价。按照《不让一个孩子掉队》法案的规定,只有极少数存在严重认知缺陷的学生才可以使用这种代替性评价。换句话说,尽管对所有学生而言,学术内容标准必须是一样的,但那些有严重认知缺陷的学生在学术成就标准(表现水平)方面可以有实质性的差别。

由于“个性化教育计划”(IEP)是评估能力缺陷儿童的核心,下面我想谈一下一件被广为误解的事情,即书面文件规定“个性化教育计划”允许能力缺陷儿童的家长和教师可以降低要求,但只能秘密地进行。许多普通教师几乎毫不知晓“个性化教育计划”的过程。对这些教师而言,“个性化教育计划”是在秘密会晤时产生的。他们认为,在秘密会晤中人们简单地降低了对个体偏差的期望,所以那些有能力缺陷的儿童便不需要像其他学生一样追求课程目标的达成。在早期,也许这种观念是正当的,但是近年来“个性化教育计划”的规定被彻底修改了。如果那些制订“个性化教育计划”的人故意把能力缺陷儿童应达到的内容标准降低到所有学生应达到的内容标准以下,那么这一“个性化教育计划”便违反了某些重要的联邦法规。

 

调整

 

一种减少能力缺陷学生评估偏差的最突出的方法就是应用评价调整(assessment accommodations)。“评价调整”是一种程序或实践,它旨在为有能力缺陷的学生提供一个公平的接受教育或评估的机会。评价调整的任务就是消除或减少歪曲推理(inference-distorting)对学生能力的影响。调整的目的不是降低教师对能力缺陷学生的期望。通常,在评估中为学生提供的调整,与教学中使用的调整类似。

尽管通过调整可以给学生提供其能力范围内的公平机会,但问题的关键在于应提供多少公平的机会。其难点在于:评价调整绝不能从根本上改变欲测知识或技能的性质。我们以阅读技能为例予以说明。教师都希望自己的学生学会阅读,不管这些孩子是否存在能力缺陷。然而,教师不能简单地一看到某学生就能判断出他能不能阅读,这是因为阅读是一项隐秘的技能。要判断学生的阅读能力,教师可以让学生参加一项公开活动,例如先让学生默读一篇短故事,之后让学生大声说出或写出故事中的主要内容。教师可以根据学生在活动中的表现,对学生的阅读技能作出恰当的推断。

但是,假设某教师打算对一位能力缺陷儿童使用评价调整,也需要对孩子大声地朗读故事吗?这肯定会是一个有意义的调整,我们假设这名儿童喜欢听大声朗读故事。但是,假设我们用书面或口头测验的形式对他听到的故事的内容施以测试,您认为根据儿童对测验的反应,教师能得出该儿童阅读技能的有效推论吗?当然不能。为能力缺陷儿童制订评价调整的教师一定要保持警惕,不要歪曲了欲测知识或技能的性质。

2005年,各州教育长官委员会(council of chief state school officers)(CCSSO)出版了一份教育和评价能力缺陷学生所需要的“调整”的分析报告。如果您想深入地了解评价调整,我极力推荐这本手册。在本章后面的“补充材料”中我引用了CCSSO手册中的内容(见Thompson et al., 2005)。手册中提供了教学或评估中常用的四类评价调整。在表4.1中,列出了这四类评价调整,对于每一类评价调整,手册中都给出了一些具体的例子。

表4.1 几类典型的评价调整

资料来源: Sandra J. Thompsonetal., Accommodation Manual: How to Select, Administer, and Evaluate Use of Accommodations for Instruction and Assessment of Students with Disabilities, 2nd ed. (Washington, DC: council of chief state school officers, August 2005), p. 14.

 

CCSSO调整手册的作者提出了一个令人信服的观点:学生应该参与选择调整的过程。他指出如果学生能够参与选择调整的过程,那么当学生进入青春期以及渴望更多的独立时,就越有可能使用这些调整。

应该怎样对待那些第一语言不是英语的学生呢?换句话说,教师该如何评价这些学生呢?首先,我们要进行概念界定,因为当前有诸多概念描述这类学生群体。在美国和加拿大,“英语学习者”(English language learners)(ELL)这一概念代表了一个多样、迅速增长的学生群体。“英语学习者”包括以下几种人群:①第一语言不是英语但略懂英语的学生;②开始学习英语,能从学校的教学中获益颇丰的学生;③精通英语,但在学术或社会背景方面需要额外帮助的学生。英语学习者还包括使用少数民族语言的学生,在家里他们会说除英语之外的另一种语言。联邦政府通常使用“英语熟练水平有限”(limited English proficient)(LEP)一词描述英语学习者。目前,人们一般称这一群体为“英语学习者”,他们认为这种称谓的政治性更为正确,但政府更倾向于使用“英语熟练水平有限”的表达。在以下篇章里,我会交替使用“英语学习者”和“英语熟练水平有限”。

如果受到过大的政治压力,几乎可以随时改变联邦和州的法律。在我结束第5版《课堂评价》的编写后,《不让一个孩子掉队》法案中阐述了两个重要的评价英语学习者的规定。然而,正如前面所说的,该法律的规定可能会改变。

我曾经指出《不让一个孩子掉队》是对1965年《中小学教育法》(ESEA)的沿袭。或许,在2007或2008年,又会对《中小学教育法》进行修订(如果您愿意,仍可以称其为《不让一个孩子掉队》)。由于《不让一个孩子掉队》法案中的某些规定遭到了强烈地抨击和辩护,或许下一个版本的《中小学教育法》会有重大的改变。所以,如果您对法律范围内的评估需求感兴趣,一定要关注诸如此类的变化。然而,直到有变化发生,NCLB才阐明了用于少数民族语言的学生的评价种类。

首先,需要确定某一亚群体学生(尤其是《不让一个孩子掉队》法案中确定的亚群体,“英语熟练水平有限”的学生便是亚群体之一)取得“适当年度进步”的程度。在NCLB测验中,对于某一学校(学区)而言,如果有足够多的“英语熟练水平有限”学生获得了“统计意义上可靠的信息”,那么,该学校(学区)所指定比例的学生应取得“精通”甚至比“精通”更好的成绩。如果没有足够数量的学生获得这样的好成绩,那么我们便认为该学校(学区)没有达成NCLB规定要完成的“适当年度进步”(AYP)。

有趣的是,为了获得“统计意义上可靠的信息”,联邦官员允许各州在确定学生(亚群体中)的最小数量时,留有一定的余地,所以,在亚群体学生的最小数量上,各州的情况迥然不同。如果某一州把其最少人数设置的非常高,那么很少会有学校或学区达不到“适当的年度进步”(AYP)的目标。这是因为,如果某一亚群体中学生的数量太少(低于州设定的最小数),那么该亚群体中差生的成绩将不被计算在“适当的年度进步”之中。相反,如果某一州把最少人数设置得非常低,那么一个或多个亚群体的缺点会造成诸多的学校(或学区)不能完成“适当的年度进步”的目标。

尽管施测于英语学习者的NCLB测验是用英语书写的,而“适当的年度进步”中要统计分析的学生只是那些连续三年或三年以上在美国学校学习的学生。换句话说,为满足NCLB所需要的亚群体分析,使用少数民族语言的学生必须参加与所有学生相同的测验,但是参加“适当年度进步”分析的只是那些连续三年或三年以上在美国学校学习的学生。(在对每位学生进行分析时,如果能够获得学生成绩更为准确的信息,NCLB允许使用其他语言进行评价。)

但是,《不让一个孩子掉队》法案包含了另一种与“英语熟练水平有限”学生相关的评估要求。法律要求各州使用分开的“英语熟练程度的学术评价”。这样,在年度基础上,我们就能评价“英语熟练水平有限”的学生在“口语、阅读、写作”等方面的技能。由于大多数州都没有现成的测验(即使有这种测验,也是用于测试新生社会英语技能的,而不是我们当前所需要的测量学生英语学术技能的),因此各州要么忙于单独开发测验,要么与其他州合作,共同开发测验。

当然,评估学生英语熟练程度测验的技术质量是最为关键的,因为它决定测验能否测出“英语熟练水平有限”学生的英语水平,进而影响对学生所处水平进行推论的有效性。因此,我们必须认真评价新收集的评价工具的质量。

那种认为由于《不让一个孩子掉队》法案进行了规定,所以只要认真对待,对英语学习者进行评估是很容易的想法是应避免的。最近贾马尔·阿比迪(Jamal Abedi)(美国英语学习者评价的领军人物之一)提出,如果《不让一个孩子掉队》要完成法案制定者打算完成的对“英语熟练水平有限”学生的测验,就必须考虑六个问题(Abedi,2004)。这六个问题的内容如下:

 

1.州与州之间以及州内不同学区、学校对“英语熟练水平有限”学生的分类具有不一致性。辨别“英语熟练水平有限”的学生时,不同的州以及同一州内的不同学区和学校往往使用不同的分类标准,这影响到对“英语熟练水平有限”学生进行“适当年度进步”(AYP)报告的精确性。

2.“英语熟练水平有限”学生的数量稀少。大部分州、学区中允许进行有意义分析的“英语熟练水平有限”学生的数量是很少的,这直接影响了州政府和联邦政府的政策决定。

3.亚群体的不稳定性。随着时间的推移,“英语熟练水平有限”学生的状态并不是稳定不变的,一所学校“英语熟练水平有限”学生的数量代表着一个变动的、潜在的难以达到的目标。举例来说,如果某一“英语熟练水平有限”学生的英语水平有了突飞猛进的进步,那么该学生便脱离了“英语熟练水平有限”学生的行列,代之以另一位英语熟练水平较低的学生。因此,即使给予最完美的教育教学,年复一年,也很难提高“英语熟练水平有限”学生群体的“适当年度进步”水平。

4.“适当年度进步”(AYP)评价工具的技术质量。研究表明,把为本土英语使用者设计的评价工具用于“英语熟练水平有限”学生时,评价工具的信度和效度会比较低。因此,当对英语学习者使用这类测验时,有可能对测验结果作出错误的解释。

5.较低的分数基线(lower baseline score)。有大量“英语熟练水平有限”学生的学校可能具有较低的分数基线,这类学校提高成绩的目标往往不太切合实际。在达成州设定的提高学生成绩水平的目标时,这类学校将面临较大的困难。

6.“英语熟练水平有限”学生的禁评分(cut-score)。与先前《中小学教育法》(ESEA)不同(《中小学教育法》规定,学生在某一科目中的不良表现可以用另一科目中的优良表现加以补偿,即补偿模式(compensatory model)),《不让一个孩子掉队》法案要求采用结合模式(conjunctive model)——在所有被评科目中,学生的表现都应为人们所接受。与对语言要求较高的阅读(语言)课相比,学生在数学课中的表现受语言技巧因素的影响较小。因此,与拥有“英语熟练水平有限”学生较少的学校相比,这种情况加大了“英语熟练水平有限”学生较多的学校获得“适当年度进步”的难度。

 

阿比迪认为,对学生进行评价时,如果考虑到以上几个问题,那么对亚群体成员的表现进行隔离,是“朝着正确的方面迈进的一步”。他指出,当初州政府和联邦政府的官员似乎考虑到了这六个问题中的某几个。阿比迪认为如果对语言学习者进行评估的问责制要真正公平的话,就有必要解决这些问题。这意味着需要教师作出明智的判断。如果让一个只能用西班牙语读、说的学生完成一份英文的数学测验,然后再根据学生较低的成绩得出该学生不会做数学题的结论,这是极不明智的。

教师是否应该编制一些非英语版本的测验,这一问题受到许多实际因素的制约。在许多情况下,教师会发现在他的学生中有十几种甚至更多的第一语言。在城市里,一个学区的学生中可以找出100多种不同的第一语言。如果教师尝试编制一份代替性评价(用学生中使用最多的一种语言编制),那么对那些第一语言未被使用的学生而言(使用这些语言的学生数量不足以确保可用该语言编制测验),这种评价的公平性又何在呢?

在这种情况下,评价调整可以依据学生的英语水平,通过给予学生更多的时间或者允许学生查字典的方式,来解决评价“英语熟练水平有限”学生时出现的问题。

当今,几乎所有的教育评价会议都会涉及如何评价“英语熟练水平有限”的学生或能力缺陷学生的问题。显然,人们正努力争取公平地评价这些学生,但需要指出的是,在对这些学生进行评价时,不能仅强调公平性,同情和准确性同样也是重要的。

2000年,为西班牙裔美国人提供优质教育的总统顾问委员会发表了一份真知灼见的报告,报告的题目为“在美国测量西班牙裔学生:技术和政策问题”。委员会通过仔细地观察指出:在大多数情况下,高风险测验对西班牙裔学生的影响,也适用于那些第一语言不是英语的少数民族学生。下面是委员会的观点:

 

目前,全国公立学校的问责制系统支持使用世界级标准。这使得州教育领导者在不准确、不恰当的测验信息的基础上,作出了高风险的教育决策,对未来西班牙裔美国学生的教育构成重大影响。成千上万的西班牙裔学生虽然不能流利地讲英语,但评价他们的测验却是用英语编写的。得出的评价数据被用来进行高风险的教育决策,例如学生升级还是留级、能否高中毕业等,而真正用于问责制的数据却很少。当谈到学校对学生的学业成就负责时,许多负责西班牙裔学生教育的机构却对西班牙裔学生视而不见。(The President's Advisory Commission,2000)

 

委员会为评价西班牙裔学生提供了18条建议,这18条建议几乎适用于所有第一语言不是英语的学生。其中几条建议恰恰代表了当前美国教育评价实践的新动向,应予以特别关注。

 

■ 不能使用翻译过来的测验。翻译过来的测验很难保持原测验的技术特性。而且,翻译过来的测验极有可能难以使用。因此,应立即停止翻译测验的工作,并停止在学生翻译测验得分的基础上进行教育决策的活动。

■ 需要有实证证据,才能证明同一测验的英语和西班牙语版本是等价的。能否对双语和西班牙裔美国学生在英语版本和西班牙语版本的测验上进行有效地、公平地比较,是一个亟待研究的问题。进行此研究的前提是,英语或西班牙语版本的测验必须是以第一语言为英语或西班牙语的被试得出相应的常模。

■ 如果不能禁止,也应力劝禁止使用口译。口译是拙劣的代替品,对西班牙裔学生进行测验的主试应该是来自他们自己社区的、富有文化底蕴而善于表达的人。(The President's Advisory Commission,2000)

 

目前,《不让一个孩子掉队》法案允许前三年用于“英语熟练水平有限”学生的数学和阅读测验可以使用本土语言编制,第四年或第五年则要视具体情况而定。负责“英语熟练水平有限”学生的教育者赞同《不让一个孩子掉队》法案提出的评价要求,尤其是对英语学习者测验分数的强制性分类,引起了人们对这类学生空前的关注。然而,这种“关注”对“英语熟练水平有限”学生的影响是利还是弊,教育者之间仍存在较大的分歧。(Education Week, March 1,2006)

很显然,对第一语言不是英语的学生进行准确地评价,是当前教师们面临的一个不小的问题。对于一份测验,既提供英语版本,又提供学生所说的第一语言的版本,这是不可能的。现在,美国正针对是否要向学校中数量较多的少数民族语言学生提供适合他们语言的测验版本进行激烈地讨论。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈