应用率最高的考试

时间：2023-02-27 理论教育版权反馈

【摘要】：每年，成千上万的学子将他们的未来押在参加SAT和ACT考试上。由于后来用测验来评估天生的、遗传决定的能力倾向失去了很多教育者的青睐，所以学习能力倾向测验也就只被简称作SAT。一种比SAT考试简单，通常针对高一或高二的学生的考试——学业能力倾向初步测验，于每年10月举行。而SAT则在先行通知后，每年举行数次。ACT的开发者们会就每项测验的内容范围向大量的中学教师和课程主任咨询意见，并就四个核心主题向大学教授咨询意见。

每年，成千上万的学子将他们的未来押在参加SAT和ACT考试（全国大学入学考试）上。由于家长和学生都担心这两种或是其中一种大学入学考试的情况并不奇怪，因此所有年级的教师们都会被问到SAT或ACT。基于此，我将在下面几段描述这两种考试的一般性质，即它们是怎么出现的以及它们的量表分是怎样的。我将公正地看待这些用于预测高中学生的大学学业成就的测验的准确性，并以此结束对这两种测验的分析。

假如您一个学生的家长，洛佩兹（Lopez）先生，在收假后的一个晚上到班上来拜访您，并向您提出了一系列关于他女儿康塞普丝茵（Concepcion）的问题。最主要的问题是，洛佩兹先生很关心每年春季在学区举行的全国性标准化成就测验中康塞普丝茵的分数。他对康塞普丝茵每年春季测验的百分位数的变化感到很困惑。他说：“前三次春季测验，她语文的百分位数是第74、第83和第71。这次又将怎样呢？她是在学习还是没学习？怎么解释这些变化呢？”

➡ 如果我是您，我会这样回答洛佩兹先生：

的确，您注意到了康塞普丝茵在标准化成就测验中的分数似乎是不稳定的。但是您需要了解的是，洛佩兹先生，此类测验尽管是全国性标准化测验，由著名的测试公司开发，并广为使用，但它们并不能非常准确地评估学生。当然，许多家长知道孩子们的测验分数是以全国性的百分位数的形式报告的，但这并不表明某个孩子的全国性百分位数就一定准确。

由于某一年的测验结果并不一定准确，所以您看到康塞普丝茵的语文百分位数每年都会发生变化，是很正常的。测量专家在谈论每次测验的“标准误差”时都承认学生的分数不会整齐划一，而这是可以预见的。这就像我们了解的全国性调查中的取样误差——“加或减一些百分点”。的确，测量误差跟取样误差是类似的。我可以肯定地告诉您，康塞普丝茵的分数每年都会变化是可以预料的。

我们能切实地看到，她过去三年的语文成绩一直是高于平均水平的。如果把她的成绩与一个典型的、全国性的常模群体作比较，她的成绩确实是非常好的。

SAT考试于1926年首次举行，最初被称为学习能力倾向测验（Scholastic Aptitude Test），被用于辅助东北部地区那些顶尖学府的招生人员招生。这个测验最初的名称展示了测验编制者们的初衷，即他们试图用这些测验来评估中学生们几乎与生俱来的学习资质。由于后来用测验来评估天生的、遗传决定的能力倾向失去了很多教育者的青睐，所以学习能力倾向测验也就只被简称作SAT。（有人认为SAT的编制者们可能是从肯德基炸鸡的供应商那里得到了灵感。那些供应商知道公众担心油炸食品有害健康，就将他们的著名商标改为简写：KFC。当然，要真正地反对任何三个字的商标是很困难的——除了美国国税局IRS。）

SAT设计之初是作为可对一个群体推行的智力测验，来比较测验参加者与生俱来的语言、数字和空间方面的能力倾向。尽管近几十年来，对评估天赋的关注越来越少了，但很多年以来，SAT都严格地按照这种方式实施。

目前，SAT分为三个部分：评论性阅读、写作和数学。除了一小部分数学填空题和在25分钟内写一篇短文之外，所有的SAT题目都是多项选择题。学生总共需要大约3个小时才能完成所有的SAT题目。SAT三个部分的每一部分都采用200到800的量表分计数。因此，在2005年加进写作测验之后，在SAT考试中学生能得到的最高分数就是2400分，即三个部分的分数总和。尽管2005年在SAT中加入短文写作吸引了大量的媒体关注，但学生的短文写作分数对他们的SAT总成绩甚至是写作部分的成绩的影响都很小，短文写作的分数约占学生分数的20％。

SAT考试一直由大学理事会（最初创设SAT的组织）管理，但从1947年以来，教育测验服务中心（ETS）则代理大学理事会开发及管理SAT考试。两个组织都是非营利性质的。一种比SAT考试简单，通常针对高一或高二的学生的考试——学业能力倾向初步测验（PSAT），于每年10月举行。而SAT则在先行通知后，每年举行数次。

尽管由于SAT和ACT都被用于预测高中生将来在大学里的学业表现，而都被认为是能力倾向测验，但是ACT在实质上是与SAT决然不同的“能力倾向”测验。“二战”以后，再加上随后施行的G. I．权利法案（一个为退役军人提供大学学费的联邦法案），更多的美国人希望接受大学教育。因此，就非常需要大学入学考试。

在爱荷华大学，才华横溢的E. F．林奎斯特（E. F. Lindquist）教授认为，尽管SAT是学生进入顶尖学府的能力倾向测验，但它并不适用于许多“二战”后的申请者。因此，在1959年，林奎斯特和他的同事们创立了美国学院测验计划这个非营利机构。1996年，该机构正式更名为ACT。

最初ACT是被用作公开的成就测验（Achievement tests）。当然，ACT的设计者们希望这种新测验能够预测高中学生在大学里的学业成就，但他们主要把这种测验当成评估学生“教育发展”的工具。

ACT由单独的测验组成，最核心的仍是最初测评的四个方面：英语、数学、阅读和科学。现在也出现了写作测验题目以供选作，学生有30分钟的时间写一篇短文，支持写作提示或是任务里给出的两个观点中的一个。跟SAT一样，ACT也需要大概3个小时的时间完成。

ACT的开发者们会就每项测验的内容范围向大量的中学教师和课程主任咨询意见，并就四个核心主题向大学教授咨询意见。他们要求中学教师确认其学校或学区的学生在高二年级末能够选择学习的技能或内容。他们要求大学教授确定在中学教授的哪些技能是学生们在大一时取得好的学业成就的关键。ACT的题目就以那些在中学中教授的内容和那些被认为是大一时获得成功的必不可少的内容为基础。

跟SAT一样，ACT题目都是多项选择题，每答对一个题就得一分，答错不扣分。每一项测验中，正确回答题目所获得的分数都被转换为1—36的量表分，进一步得出这四项测验1—36量表分的平均分（不像SAT，SAT的总分为三部分分数相加）。与SAT的短文测验相似，选做的写作测验以2—12的量表分为基础进行计分（两个阅卷人每人可给文章打1—6分）。

与SAT一样，用于更低年级学生的ACT测验有所不同。

由于高中生在SAT和ACT中获得的分数关系到重大决定的作出，所以每次测验之前就必须作准备。这些考前准备工作，包括耗费低的打印资料或在线材料，以及昂贵的一对一冲刺班或辅导。虽说也有例外，但花在这两种测验准备上的钱越多，准备也越有效。这个事实当然令人不安，因为从富裕家庭出来的孩子更有机会得到昂贵的辅导，也就比家境不那么富裕、不能支付昂贵的考前辅导费的同学取得的分数更高。

尽管上述情况很重要，但我们先把考前准备中出现的不公平现象放在一边。对于所有的教师来说，认识到SAT和ACT的预测准确性最为重要。下面以斜体字标出的就是这个问题：

在大学中，仅有25％的学业成就是与高中生在SAT和ACT中的表现相关的。

为了评估一个高中生在大学入学考试中的分数，准确预测他（或她）在大学中的学业成就，我们计算了高中生的SAT或ACT分数与他们大学成绩（如他们大一学年的平均积分点）的相互关系。大多数情况下，得到的相关系数大约为0.50。0.50的预测系数在统计学上是相当大的，这就明确地显示了学生在大学入学考试中的分数与他们的大学成绩是真实相关的。

然而，要确定这个相关的实际意义，我们必须将0.50系数开平方（0.50×0.50＝0.25）得到0.25。这意味着学生大学学业成绩的25％与他们在大学入学考试中的表现有关。换句话说，一个学生大学成绩有75％是SAT或ACT得分之外的其他因素决定的。此类因素包括学生的动机、学习习惯以及其他学生能够实际控制的因素。

那么，只要您不是一个数字白痴，您就会明白一个学生的大学成绩相对于入学考试因素而言，三倍依赖于非考试因素，即75％（与考试不相关）对25％（与考试相关）。但我们发现大量在SAT或ACT测验中成绩不理想的学生，都认为自己不够聪明，不能在大学取得好成绩。大学以及整个人生的成功，无疑依赖比考试成绩更多的因素。不幸的是，由于我国的教师们通常并不熟悉大学入学考试的预测存在不准确性，所以他们在劝阻学生贸然地放弃读大学的愿望这一工作上做得并不够。

这些年来，对于许多教师和学生自己来说，SAT或ACT分数成为定义学生能力的不变准则。这不是事实。不仅教师们需要了解这些，他们也要确保学生及家长了解这些。

申请入学的学生比学校招生计划提供的名额要多，SAT和ACT帮助大学工作人员根据招生名额来筛选申请者。但SAT和ACT一般的预测能力并不能使其转化成对某一学生的准确评判工具。所有年级的教师们都需要帮助学生认识到什么是SAT和ACT考试能做到的和不能做到的。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈