国内外相关研究现状分析

时间：2022-03-07 理论教育版权反馈

【摘要】：我国的教育评价在很大程度上受到这一定义的影响。我国高等教育评价的研究表现出鲜明的“实践先行”特色，主要的研究集中在高等教育评价实践问题的解决，这与我国最早研究教育评价的学者主要是教育管理的实践者有密切关系。高等教育评价基础理论的研究成果不如实践的研究成果多，理论研究基础相对薄弱，对具体化的东西的研究往往超过了对高等教育评价目的、本质、对象及其属性本身的研究。

第二节　国内外相关研究现状分析

高等教育评价是教育评价的重要组成部分，高等教育评价理论是将教育评价理论与方法运用于高等教育评价中逐渐形成发展起来的。因而，用教育评价发展的理论脉络，结合评价在高等教育发展中的实践探索，基本上可以对高等教育评价问题的研究作出释解。

一、关于教育评价基本问题的研究概要

1.国外关于教育评价概念的观点

教育评价是什么，理论界至今对这一问题仍有歧义。从定义来看，教育评价的定义各有差异，并且常常反映了界定者所关注的特殊问题。从评价概念发展的历史来看，即从教育评价历史发展的长河来考察，主要有以下几种评价观：

20世纪初，美国教育心理学家桑代克、赖斯等人开创了教育测量领域，其后兴起的“教育测量运动”，使得运用教育测验方法研究教育质量问题成为一种共同的选择。20世纪30年代泰勒（R.W.Tyler）进行了著名的“八年研究”（1933—1940），直接催生了教育评价学，为此泰勒也被誉为“教育评价之父”。泰勒将教育评价看成是判断教育活动达成目标程度的活动，认为“教育评价过程实质上是一个确定课程与教学计划实际上达到教育目标的程度的过程”，并发展了著名的“目标导向”的教育评价模式，在现实的教育评价实践中发挥了重要的作用。但目标导向的评价经常面对教育目标自身科学性的挑战，20世纪60年代后对泰勒评价思想和模式的批判大大推动了教育评价发展，形成了多种具有重要影响的教育评价模式。

60年代初克龙巴赫（Cronbach. L. J 1963）提出，教育评价的本质应当是推动教育活动的改进，他认为“评价能够完成的最大贡献是确定教程需要改进的方面”，并提出了形成性评价的思想。他将教育评价定义为“为作出关于教育方案的决策、收集和使用信息”的活动，这样的思想受到教育工作者的欢迎，在西方教育评价界产生重要影响。但按照这样的思想，教育评价仅仅变成收集信息的活动，无法更多地发挥教育评价的作用。

斯塔弗尔比姆（Stufflebeam 1969）提出的评价观与克龙巴赫有相似之处，都反对把评价仅仅看做是“对不法行为做出的严密调查”。1969年，他提出评价是“为决策提供有用信息的过程”，并提出了具有重要影响的CIPP评价模式。为使他的评价概念与所提出的CIPP模式相匹配，1978年，他将评价重新界定为：“为满足决策和教育效能核定的需要，描述、获得和运用有关客体的目的、计划、过程和成果价值的过程”。到1985年，在斯塔弗尔比姆和申克菲尔德（Stufflebeam and Shinkfield 1985）撰写的《系统性评价》中，他进一步提出：“评价是一种划定描述、获取和提供叙述性和判断性信息的过程。这些信息设计研究对象的目标、设计、实施和影响的价值及优缺点，以便指导如何决策，满足教学效能核定的需要，并增加对研究对象的了解。”斯塔弗尔比姆CIPP评价模式的影响比他的评价思想影响更大，直到目前仍然是被采用更多的评价模式。2000年，又提出了补充与诠释，其中将产出评估后半阶段重点程序又区分为：影响（impact）评估（方案影响并服务合法或目标受益者的程度）、有效性（effectiveness）评估（对服务个人或团体所产生的效果如何）、可持续性（sustainability）评估（计划/方案的可持续性程度）与可应用性（transportability）评估（计划/方案的可应用性程度）。^[2]

美国教育评价标准联合委员会（JCSEE）对教育评价的定义很大程度上受到斯塔弗尔比姆评价思想的影响。这个由12个与教育评价有关组织的联合机构，在1981年对评价做了一个简明的界定：“评价是对某些现象的价值，如优缺点的系统调查”，该定义在相当一段时间里左右着美国的教育评价活动，在很大范围里被当成权威定义而广泛接受。我国的教育评价在很大程度上受到这一定义的影响。

1975年，斯塔克发表了《方案评价的特殊方法—应答评价》一文，提出评价应首先关注服务对象关注的问题、兴趣和焦点，而不是预先确定的目标，并提出了一个以“回应”服务对象为起点的评价模式，即评价界所称的“应答评价”或“回应评价”（Responsive Evaluation）。1981年，基于斯塔克的“应答评价模式”，枯巴和林肯发表了《有效的评价》一文，提出评价的出发点应该是应答或回应评价利益相关者（stakeholder）的要求。1982年，他们又发表了《自然主义探究的认识论和方法论基础》一文，提出了评价的建构性探究方法（The Methodology of Constructive Inquiry），主张评价应该在自然情境下进行，更多地使用质性评价的方式，而不能为了追求评价精确而失去了评价应有的深度和意义。

2.国内关于教育评价基本问题的研究

教育评价最早介绍到我国可以追溯到20世纪30年代，现代教育评价理论进入我国并被用于高等教育管理活动则是从20世纪70年代末开始的，最初主要集中讨论高等教育评估问题，80年代后逐步扩展到基础教育，其后在政府教育行政、学校改进、课程与教学改革、学生选拔、教师考核与激励、教育项目等众多教育领域被广泛运用，作为学科的教育评价学逐步形成并不断趋于完善。

我国高等教育评价的研究表现出鲜明的“实践先行”特色，主要的研究集中在高等教育评价实践问题的解决，这与我国最早研究教育评价的学者主要是教育管理的实践者有密切关系。直到今天相对于评价实践研究而言，理论研究仍然落后和不受重视，通常理论的研究只满足于应付眼前的需要，缺乏超前的意识，缺乏基础性的研究工作。高等教育评价基础理论的研究成果不如实践的研究成果多，理论研究基础相对薄弱，对具体化的东西的研究往往超过了对高等教育评价目的、本质、对象及其属性本身的研究。

从教育评价及高等教育评价的研究现状来看，国内的研究成果主要是循着两条主线来发展的，即：教育评价的理论的研究和评价的实践形态及具体问题的研究。归结起来，可从以下几个方面作梳理。

（1）关于教育评价的基本理论研究

就文献资料的内容来看，80年代主要是引进和借鉴西方国家的教育评价、高等教育评价理论，90年代起我国相继出版了一批能在一定程度上反映中国特色的高等教育评价专著。其中我国教育评价理论研究比较有代表性的学者是陈玉琨教授及其带领的团队，他们从20世纪80年代初开始最早全面介绍西方评价理论、研究教育评价技术方法，其后对教育评价的本质、价值、主体与客体、步骤与程序、技术与方法等方面的问题进行了全面探索。陈玉琨教授在其专著《中国高等教育评价论》（1993）和《教育评价学》（1999）中，对教育评价的本质、价值、主体与客体、目的与原则、步骤与程序、标准、方法论及技术与方法、评价误差心理以及政府、社会、学校在教育评价中的地位、作用和相互关系等，都作了颇有见地的论述，在对教育评价的价值、地位与作用等方面取得了一些与西方不同的成果。^[3]其中，关于教育质量保障的研究基本上保持了与国际同步发展。代表性成果有：陈玉琨、代蕊华编著的《高等教育质量保障体系概论》对西方高等教育质量保障的基本模式、价值取向和方法作了详细介绍，并对我国高等教育质量保障体系的建立的必要性、可行性、基本思路、指标体系和组织体系作了初步探讨。^[4]陈玉琨著的《发展性教育质量保障的理论与操作》介绍了他所领导的课题组在充分吸收国外经验的基础上，自主开发的教育质量保障体系。包括发展性教育质量保障的理论基础、整体框架与实施步骤、远程支持系统等，^[5]在引进、借鉴西方的基础上形成了不同于西方的研究成果。沈玉顺著的《高校教学质量保障的思想与实践》分析研究了国外高校教学质量保障的基本思想和实践，系统总结了国际高校教学质量管理的先进经验和理论研究成果；并以我国高等教育改革与发展为背景，探索了在我国高校建立教学质量保障系统的理论和实践基础，构建了符合我国高等教育实际的高校教学质量保障体系的基本框架和具体方案。^[6]

（2）评价的实践形态及具体问题的研究

有关教育评价实践领域的具体问题研究文献很多，比较繁杂而且零散。关于高等教育评价问题，研究主要集中在以下几个方面：关于本科教学评估标准与指标及存在问题的研究；关于高等教育评价主体与评价专家的研究；关于高等教育评价方法、技术的研究；高校教师评价的发展趋势及实践中存在问题的研究；关于大学生综合素质评价及课堂学习评价的研究等；关于我国高等教育评价未来走向的研究；关于国外高等教育评价模式的研究等。

还有研究者尝试从不同视角分析我国高等教育评价的某方面问题，如有学者从博弈论的视角揭示了我国高等教育评估的矛盾，认为我国高等教育评估制度是管制主义体制下的产物，过于关注政府权益而忽视了高校的利益诉求，从而衍生出了不少弊端与问题，如评估的缘起，评估主体与评估客体之间体制问题导致评估的“寻租”现象，评估机构与高校之间，高校与高校之间的不完全信息博弈等。^[7]

有研究者从政策范式的角度对我国高等教育评估进行了政策分析，认为政策范式变革是对过去政策显著的突破，从这一视角来看，自1985年以来，我国高等教育评估政策可划分为四个阶段：政策形成及相对稳定阶段，政策环境转化阶段，政策进一步调整阶段，新政策范式确立阶段。并提出我国下一轮本科教学水平评估新政策的制定除了应结合分类指导、多元参与、综合评价等原则外，还需借鉴运用社会问责理论来构建新的政策范式，即基于社会问责的多元化综合评估。^[8]

有研究者借鉴公共治理的基本理念重新审视高等教育评估，提出了公共治理视野下高等教育评估的供给模式，构建了高等教育评估的公共治理框架。^[9]

（3）从近年来国内的博士论文选题来看，关于高等教育评价的学术研究主要集中在以下几个方面：

有从价值层面研究教育评价的，如从价值的视角去追问大学教学评价，从而发现和挖掘大学教学评价的问题，对大学教学评价作宏观的深层次的思考和探索^[10]。有论者在对教育评价历史发展的价值取向进行分析时，对当前我国教育评价理论研究存在问题与实践误区的价值取向进行分析的基础上，提出了基于价值尊重与价值认同的教育评价的理念、原则与专业建议。^[11]

有关于发展性高等教育评价的理论与制度的研究，如有论者对发展性高等教育评价的必要性和可行性、理论基础、本质论、价值论和实践论进行了相关研究，并从评价制度、评价内容和评价指标与方法三个范畴构建了发展性高等学校评价的实践模式。^[12]

有关注高等教育评价某一方面具体问题的研究，如有研究者在对高等学校学科竞争力理论分析框架进行建构的基础上，具体探讨了高校学科竞争力的评价方法。^[13]有论者从大学教师评价制度层面着手，对大学教师评价制度进行了理性上的重新审视和思考，并提出了行动建议。^[14]有以生存论为理论基础试图确立一种新的教育评价观，重新认识教育评价中的“人”和选择恰当的促进人发展的方式，重新诠释教育评价的目的观、标准观等教育评价的基本问题。^[15]有论者以美国博士生教育评估为对象，以评估体系的有效性为切入点，从历史发展和结构分析两个维度，全面解析了美国博士生教育质量评估体系的特征与未来走向。^[16]

有论者从元评价的视角，把高等教育评估质量保证作为研究对象，对我国高等教育评估进行了反思与批判，探讨了我国高等教育质量保证的原因，高等教育评估质量保证应遵循的质量标准及我国高等教育评估质量保证的具体实施等。^[17]

此外，还有关于高等教育评价方法的研究，如高等教育评价方法的研究^[18]；有关于评估中介机构的研究，如教育评估中介机构研究^[19]；有关于高等教育质量保障的研究，如高校教学质量保障模式的研究^[20]、高等教育质量保证模式研究^[21]；这些研究都较为深刻地揭示了高等教育评价某一方面的特质、属性、规律和问题。

分析这些研究可以看出，在研究内容上，现有的研究以评价活动中具体问题的研究居多，关于评价的方法论、价值基础等深层次问题的研究还有所欠缺。我国目前对国外评价理论研究多局限在描述性介绍，对其评价体系的有效性，评价设计的价值基础、假设前提等方面还缺乏深入的分析。在研究层次上，以经验的、事实的或技术的总结与描述居多，对具体化的东西的研究往往超过了对评价的本质、价值基础及评价方法本身有效性等的研究。

二、第四代评价理论的思想及应用的研究

20世纪80年代末，由著名评价专家枯巴和林肯（E.G.Guba and Y.S.Lincoln）出版了《第四代评价》的专著，在反思、批判传统评价理论的基础上，提出了“第四代评价理论”。“第四代评价理论”很快在欧美各国的课程评价、教育评价者中产生了巨大的反响，并进而成为评价领域研究人员关注的一个理论探讨热点。

枯巴和林肯在反思教育评价理论基础上将以往教育评价理论分为三代，并提出了第四代教育评价理论思想。认为第一代评价把评价作为一种测量活动（1900—1930）；第二代评价着重描述绩效与目标的匹配程度（1930—1940）；第三代评价强调以一种方式作出判断（1950—1970）^[22]。第四代教育评价认为，前三代评价理论的不足之处在于，对价值多元的排斥问题；对已接受范式的过渡推崇；官僚主义弊端等。第四代评价采取以“回应”各种与评价利益相关的人为评价的出发点，提出了“回应—协商—共识”的线索，以“协商”为途径达成共同的“心理建构”。它在技术方法上，主要采用了解释学的方法，形成了自己完整的评价程序。枯巴和林肯认为，正是由于这些特征，使得第四代评价能够解决前三代评价长期面对的难题。

第四代评价听起来是诱人的，但这一方法的可操作性程度和成效有待于时间的检验，其繁杂的程序、过高的成本使人们不得不思考是否值得去这样做。如何发展和完善第四代评价理论是当前西方教育评价理论研究的前瞻问题。近年来，枯巴和林肯第四代评价方法的效用问题已经成为评价领域争论的一个焦点，大部分争议集中在假设的实现问题方面。有代表性的研究有如下几种：

有论者对第四代评价理论的有关思想及其价值进行了评论。如詹姆斯·黑普认为，枯巴和林肯提出的第四代评价理论中，相对主义和主观主义的言论在评价中是无用的，从逻辑上看，在评价领域中不可能有一元论的建构探询方法。从伦理上，一元论的建构探询方法是值得怀疑的。他提出：评价的探询方法应该摒弃一元论的、极端的相对主义和主观主义。第四代评价的价值在于它清晰地阐述了一种协商、共识的评价方法，这一方法给利益相关者各方提供了表达各自意见的机会。^[23]（James L.Heap，1995）

一些学者讨论了第四代评价在学校环境中应用的有关问题，并提出了一些建议。如尼尔·罗素和约翰·威林斯基将第四代评价与以前的校本评价方法相比，第四代评价在学校环境中的应用显示出优势，并对如何更好地使第四代评价应用在学校环境中，提出了一些针对性的建议。他们认为第四代评价对在利益相关者之间发展替代性经验的做法，具有特殊的意义。它能够丰富学生的学习经验，提高评价在实践中改善学校教学的可能性。第四代评价方法为那些希望更积极地参与到课堂评价中的教师提供了鼓励和指导，为进一步促进教师的专业发展，提供了一种变化的刺激和实践的框架；教师可以通过运用第四代评价有机会对他的工作改进创设一种特殊的环境，可以通过咨询和与他人合作不断改进教学。但将第四代评价运用到课堂中时，也面临着一些挑战：评价结果的发布方面，考虑到利益相关者可能是教育部官员的情况，如果其他利益相关者并不愿将有关学生成绩和表现的信息提供给区一级官员，这就使评价变成了需要解决的政治问题；如何解决评价的动员阶段，需要花费大量的时间与教师教学的冲突问题等也是面临的挑战。^[24]（Neil Russell and John Willinsky，1997）

有学者把第四代评价的方法直接运用到实际的评价活动中来讨论它的优势和局限性。如霍伯纳和贝茨将第四代评价方法运用到社区与大学的合作的项目中，通过方法的实际运用来讨论它的优势和局限性。揭示出第四代评价的优点：多方的利益相关者的参与，能够公开他们多元的价值观，这样能够在早期就培养出他们对后续项目足够的支持与责任。局限性包括：鉴定利益相关者的困难；第四代评价要求利益相关者无需接受他人的价值观，但要了解他人的看法，在如何保证理解他人看法方面还缺少具体的指标的衡量和措施的指导；如何实现第四代评价中对利益相关者授权的目标方面，也缺少一些具体的操作性指导措施。从这一方法的应用中获得的信息对那些致力于追求使用第四代评价方法的人来说，具有很强的实践指导意义。^[25]（Angela J.Huebner and Sherry C. Betts，1999）

汤姆·奥尼尔（Tom O,Neill）通过运用第四代评价方法对南非德班的科学教育项目进行评价，着重讨论了第四代评价在实际实施中存在的一些问题。他认为：第四代评价理论将建构主义思想引入到评价理论中，这将评价理论向前推进了一步；在利益相关者的权力和能力建设方面，是这一评价方法比较有价值的目标追求；第四代评价理论所倡导的所有利益相关者都能充分参与，甚至评估对象中的大多数利益相关者都能够充分参与到评价中，可能是一个不现实的假设；如何提高这一方法的可操作性，克服它的不足是今后努力的方向。^[26]（Tom O,Neill，1995）

玛格丽特·雷和伊雷娜·帕帕佐普洛斯将第四代评价方法运用于英国“良好开端”（Sure Start）项目的评价，从理论及其操作层面描述和探讨了第四代评价方法在实践运用中的一些问题，并探索了怎样更好地使这一评价方法符合建构主义范式所描述的真实性评价标准（authenticity criteria）的原则问题。^[27]（Margaret Lay and Irena Papadopoulos，2007）。

也有学者为使第四代评价更加实用，进一步充实和发展了这一评价模式。如英国艾塞克斯大学的理查德·劳克林和简·布劳德本特为使这一方法更加实用和与具体的评价更加相关，运用案例研究进一步重构和发展了第四代评价方法，有针对性地提出了一些可能的解决措施，主要包括对唯我论者在该方法上的质疑的解答；对评价者与委托人之间的一些潜规则的解决和对评价程序与方法的论述不够详尽的方面提出了解决方案。^[28]（Richard Laughlin and Jane Broadbent，1996）

进入新世纪，第四代评价理论的创立者之一林肯（2001）发表了《新世纪的第四代评价》一文，进一步探讨了第四代评价的发展和应用前景。林肯认为：新世纪未来的五个发展趋势将使第四代评价强大、重要和适时。即第一，后现代主义，特别是后现代主义排除虚无主义赞同更加乐观的未来；第二，在社会科学中，被贝斯特和凯尔纳（Best＆Keller，1997）和布洛南（Bloland，1995）称之为“解释学转向”（the interpretive turn）的更加广泛的运用；第三，政治认同的作用，特别是要求使先前沉默的群体也介入的作用；第四，冲击世界文化的全球主义和合作主义；第五，一种对中东、印度次大陆和环太平洋国家后殖民主义批判的敏感性的增加。林肯认为，后现代主义、解释学转向、政治认同、全球化和后殖民批判，这五种影响因素争论的观点和政治影响将被广泛地植根于社会、经济、政府决策和立法体系等社会活动中，即使各个因素在不同时期所彰显的作用不同，但也将会成为社会变革的强大的影响力。把这些社会影响力考虑进第四代评价，是因为第四代评价的设计能够和这些重大的社会影响力相一致或者是能够对这些思潮和影响力做出回应，因此，第四代评价模式的可行性甚至蓬勃发展的机会将会大大加强。^[29]（Yvonna S. Lincoln，2003）

三、关于教育评价范式及范式转换的研究

1.国外的研究

从国外的评价研究文献来看，20世纪60年代以来，每一种评价模式的出现，都会引来人们的争论与探讨。随着评价模式的发展和分类的形成，人们开始对不同的方法进行理论和实证分析。研究者们通常依据对评价模式分类及评价模式背后的哲学假设、指导原则等特征来对评价范式进行探讨，比较有代表性研究及观点有：

豪斯在对评价模式进行分析时指出：“理解评价模式的主要因素是它们的判断准则、认识论和政治基础的区分”。同时，他指出“现行的评价模式都源于自由主义哲学”。^[30]

斯塔弗尔比姆等（2000）在《评估模型：教育及人力服务的评价观点》一书中，检视了美国在20世纪60年代与1999年间出现的22种评估模式，他依据评估是指“一项研究，其设计及实施是协助评估报告阅读者评价任一对象的优点与价值”这一定义，将22种可供选择的方案评估模式分为四类：假评估；问题/方法取向评估模式（准评估研究）；改善/绩效问责取向评估模式；社会议题导向（倡议）之模式。描述了每一种模式的特征、优点和缺点，并考虑其是否能继续加以运用，最适运用的时机与做法等。斯塔弗尔比姆指出了出现在20世纪的各种评估模式中，九种公认最有力的、且最有希望在21世纪持续地加以应用与发展的模式，即决策/绩效问责模式、消费者导向模式、认可制度模式、实际利用为焦点模式、委托人中心模式、民主审议模式、建构主义模式、个案研究模式、成果监控/附加价值模式。他认为，除了假评估外，其他的模式逐渐趋向平衡的追求严谨、关联与公正。这些模式表现出强烈的倾向，那就是注重利益相关群体的参与投入，以及使用多元的方法。^[31]（Daniel L. Stufflebeam，2000）

库克和沙迪什（Cook and Shadish，1986）描述了评价活动的三种范式。第一种是实验法，它寻找的是“可操纵的解决方法”，并会对可测量的项目效应作出估计。第二种范式是“利益相关者”式方法，它意在向各利益群体提供他们想要的和需要得到的信息（Patton 1986，Stake 1975）。第三种范式是解释性方法，目的是提供“一般化的解释”（Cronbach 1982，Chen and Rossi 1983）。“利益相关者”式方法力图使评价活动能回应项目的需要，而解释性方法会更好地利用项目理论来为评价过程建模。解释性方法能为记录和理解项目的性质和效果提供一个更全面的框架。^[32]

美国哥伦比亚大学程星教授在对美国高校常用的评估范式，即“评估回馈模式”进行概括、反思、批判的基础上，认为要想在高等教育市场化形势下让评估为公众问责服务，对传统的评估范式进行改造势在必行。他提出了一个新的三级评估范式（如下图1-1所示），以对公众需求的信息作出回应。新评估范式的三个等级需要展示学生学习的成果、显示高等教育投资回报率和确保高校的社会效益。在这个三级评估范式中，评估活动根据信息接收端的需求展开，并且上一级的评估总是建立在下一级评估所提供的信息基础之上。^[33]

图1-1

很显然，教育评价理论研究中一直存在评价范式和方法的争论，“在20世纪70年代早期，大多数的实际评价者都倾向于逻辑实证主义、目标认识论、效用价值观和能收集及解释评价数据的量化方法。围绕着量化方法，早期的评价工作取得了一些一致的观点。大多数的评价者对于更主观、现象学的认识论、多元主义价值观、自然主义和质的方法都采取回避的态度，他们认为这些东西都是软性的，所以不大接受”^[34]。20世纪80年代以后，越来越多的评价研究者逐渐认识到质的方法并非一无是处，目的、效用未必是最好的选择，“评价者也开始接受多元化的现实存在，或者至少同意对现实的感知是多元的”^[35]，对原有的评价范式开始了全面的反思，被称之为“第四代评价”的评价范式在教育评价活动中的影响越来越大，逐步得到认同与接受。

2.国内的研究

国内对我国有关教育评价范式及范式转换的研究，主要有以下几种观点：

有论者从方法论的层面来理解教育评价范式，如认为在某种意义上，方法论与范式这两个词语可以互相通用或替代。据此，认为大学教学的评价范式包括实证主义的评价范式与人文化的评价范式。并进一步分析了在教学评价范式过程中，评价标准的可测性与模糊性、教学质量的认定和评价的复杂性等因素使两种方式的选择面临着矛盾和困境。认为从我国高校教学评价存在的现实问题来看，总体趋向表现出实证化突出，同时其在定量分析方法上也显示出科学性不强。并提出我国评价范式的关键在于实证与人文的整合的建议。^[36]

有论者在追述了西方教育评价的科学观及其方法论的演变过程的基础上，进一步分析了我国教育评价的科学观及其方法论的演变过程，并提出了我国教育评价研究的科学观及其方法论取向。认为我国教育评价研究，经历了从单一的科学观及其方法论向整合的科学观及其方法论的演变。我国教育评价研究的科学观及其方法论可以分为两大类共七种：①单一的科学观及其方法论，或实证主义的，或人文主义的，或后现代主义的。②整合的科学观及其方法论，或实证主义和人文主义的整合，或实证主义和后现代主义的整合，或人文主义和后现代主义的整合，或实证主义和人文主义以及后现代主义的整合。^[37]这种对评价方法论演变的分析类似于前面所述的有论者提出的从方法论层面理解的对评价范式的分析。

有论者认为：范式是一套相互关联的概念，他提供了人们观察和理解特定问题和活动的框架，决定了人们的目的、解释观察到的现象以及解决出现问题的方式。当老的范式不能解决突出的问题时，范式便要发生变革。认为教育评价范式变革的表现是从常模参照到标准参照、从量化表征到质性描述、从情境无关到情景关联、从限定孤立到支持合作、从静态判断到动态分析。^[38]

有论者指出我国当前教育评价范式的变革过程，正沿着“非此即彼”的变革路向推进，其中呈现出诸多的矛盾和冲突。以基于“课程标准”的教育评价范式作为平衡点，可以看出，教育评价范式对变革中产生的矛盾和冲突是从量化测评到质性描述、从情境无涉到情境关联、从独白控制到对话协商、从预设判断到动态生成。这一变革始终遵循着从总结性评价向形成性评价转变的逻辑。^[39]

有研究者认为：教育评价范式有教育共同体认同的独特的价值取向、理论和实践规范，在某一时期是教育的常规。但教育评价范式并不是凝固不变的，当它不能适应时代要求，与教育理论研究和教育实践产生尖锐的矛盾时，评价范式会在价值取向、评价内容、评价方法、评价主体、评价解释等方面发生变革。教育评价共同体成员具备了新的评价素养，能在教育中运用新范式所需的评价方法和技术，并得到教育制度的保障，这时，教育评价范式才能真正成功转型。^[40]

有研究者把评价范式的转换理解为评价方式的转移或革新。如有论者认为，20世纪90年代以来，教学评价实践领域出现了许多新的评价方式，这些评价方式与早期传统的以测量为模型的评价相比，在理念、目的、方法与技术方面发生了质变，具体表现在：从量化测评到质性分析、从情境无涉到情境相连、从独白控制到对话协商、从预设控制到动态生成，把这种变化称之为现代教学评价理论的范式转换。^[41]

有研究者指出，实现高等教育质量主体与评估范式的转移，是我国高等教育进入评估时代的应有之举。大学生是质量的主体，将大学生就读经验作为高等教育质量的重要监控依据并将其整合到高等教育评估活动中去，对实现高等教育质量评估目的有重要意义。要对高等教育质量进行测量和评价，必须从学生的学习经验出发，评估的范式要转到对学生就读经验的评价上来。范式的转移对高校提出了新的质量要求，为评价高等教育质量提供了新视角。^[42]这种理解实际上是把范式的转移理解为评价关注点的转移或革新。

此外，还有论者对高等教育评价模式的影响因素及好的评价模式的特点进行了相关论述，认为影响高等教育评价模式形成和发展的主要因素是高等教育规模的扩张和高等教育管理制度。评价模式没有绝对的好坏之分，任何模式都有可能做到最好，好的模式应有如下特点：第一，评价模式本身应与高等教育系统相适应，要与高等教育的传统、规模、扩张的方式等结合起来，否则会产生很多的矛盾和冲突；第二，模式研究的意义在于充分发挥模式中好的一面，同时规避缺点，因此要对模式进行深入分析，以便不断改进；第三，好的评价模式本身并不是不变的，相反，它需要根据所在高等教育系统的变化不断进行调整；第四，任何政策的出台都要考虑到与模式现有制度的协调问题，模式内的制度冲突是影响模式发挥自身优势的最大因素。^[43]

综合看来，研究者对教育评价范式及范式转换的理解和描述不尽一致，或把范式理解为方法论，或理解为一种评价的方式等。从某种程度上来说，研究者只是意识到了我国教育评价需要变革或正在发生变革，对于已有的评价活动中表现出的“范式”特征缺乏系统的研究；不少所谓的研究，实际上还处在简单描述的层面，尚未进行深入、系统的探讨。对高等教育评价范式为什么要转换，即新范式建立的需要还没有深入地分析和研究，研究还未涉及到对高等教育评价范式的内涵的深入分析，对新的评价范式的理论框架也还缺少系统的论述和研究。

四、关于协商与协商机制的研究

从国外的研究来看，自从政治学学者约瑟夫·毕塞特（Joseph M. Bessette）于1980年第一次在学术意义上将“协商”与“民主”联用创造出“协商民主”这一概念以来，“协商”的功能和价值被大大丰富和拓展了。近年来，有关协商民主的讨论更是成为西方政治学、行政学研究领域的前沿和热点。^[44]

在教育评价领域，一些评价文献强调了评价者应该把拥有和运用协商技巧作为评价能力的基本素质，并讨论了作为协调者所应具备的协商技能。如安尼·马克维茨提出了在评价实施过程中，协商的一些策略性原则及技巧，认为评价者进行协商时应遵循以下六条原则：①认识评价内在的政治本质；②重视多个利益相关者的贡献；③注重利益相关者的立场和对评价计划的评价；④评价者应该在利益相关者之间扮演一种积极的角色；⑤评价者要具备作为协商者应答冲突的技能；⑥开发管理多元利益相关者之间冲突的技能。他认为评估者利用这些原则可以使利益主体对所有利益立场有清晰的理解，同样也包括评估者的立场，这些原则使得相互理解和提高认识成为达成共识的基石。^[45]（Anne Markiewicz，2005）

戴安·麦克唐纳提出的将协商落实在评价实践层面，评价者应具备的技能，包括沟通、移情和自信，以及鼓励利益相关者互相倾听、尊重和达成共识的能力。并讨论了在评价过程中，当利益相关者之间的达成共识并非总是可能或可取时，评价者需要具备的技能和素质^[46]（Diane McDonald，2008）。

有论者研究了在具体的评价中，如何运用协商程序解决冲突和问题。如劳瑞·史蒂文等人从社会心理学的视角呈现了冲突策略理论和建设性的冲突解决理论，认为这些理论对于管理评价中的冲突是有用的；并讨论了在建设性地管理项目评价中的冲突方面，如何运用协商程序解决项目评价中的问题和冲突^[47]（Laurie Stevahn，Jean A. King，2005）。西沃恩·夏基等给出了如何在社区项目评价中运用协商的一些建议，着重强调了评价者应该具备的一些关键技能：包括运用情感体验、给面子（face-giving）、融洽和创造性思维、对时机的判断和掌控能力等。^[48]（Siobhan Sharkey and Anne Sharples，2008）

综合看来，国外的评价文献中对协商的探讨主要集中在评价者作为协商者所应具备的一些进行有效协商的技能、技巧，在评价实施中的一些协商原则和策略，以及影响协商的因素等方面。在当代价值多元化的背景下，如何建立有效的协商机制，通过规范体系和制度安排确保价值协商在评价实施中的有效性，使多元价值在协商和评价理论的框架和方法里得以彰显，在评价文献中并没有很明确、具体地探讨。

从国内的研究来看，我国关于协商及协商理论的研究主要是在政治、经济和法律领域。在我国高等教育评价研究领域，还没有出现关于协商机制的研究，还没有涉及通过建立价值协商机制解决评价中的价值多元问题的系统研究。

关于协商机制的研究，仅在我国高等教育研究领域，在涉及高等教育治理问题的研究时，有论者提出政府的单中心治理已难以解决日益复杂的高等教育问题，必须通过分权或联合其他社会力量实行多中心治理。为了实现不同主体之间的共同利益最大化选择，使参与协商各方的合作伙伴关系制度化，有必要构建参与协商机制，这种机制的建构可通过分权机制、激励机制、制衡与监督机制和问责机制来实现。^[49]

五、对国内外研究现状的分析与认识

1.解决价值多元问题，确定并保持多元价值视角开发教育评价方法技术已成为国际教育评价界共同考量的关注点。

新近开发出的评价法，它们的一个共同点就是价值的多元化，即确定并保持多元价值视角；注重利益关系人的民主参与；在收集和解释评价信息时，强调应答和协商。枯巴与林肯（1985，1989）是首先运用建构主义模式在方案评估上的先驱。波拉（Bhola，1998）是枯巴的弟子，他具有在非洲运用此种模式的多方面经验。和枯巴的看法一致，他强调评估不只永远是评估者所采用的方法及与利益关系人之间互动的一项功能，也是评估者个人经历和展望的功能。费特曼（Fetterman，1994）的赋权评价（Empowerment Evaluation）模式与建构主义模式渊源密切，都是寻求纳入及服务所有的利益关系人，特别是那些没有影响力的人。新近出现的由豪斯与豪（House＆Howe，1998）倡导的民主审议评价（Deliberative Democratic Evaluation）模式也强调在评估的各个阶段，努力使利益关系人民主的参与，评估者通过和利益关系人的对话、讨论来达成关于方案优点和价值的可辩明的评估。

2.如何发展和完善第四代评价理论，在实践中解决第四代评价的有关操作性难题，是当前西方教育评价理论研究的前瞻问题。

第四代评价的真正意义在于它关注价值多元，对利益相关者赋权，坚持协商和共识的原则等，第四代评价通过分担责任、尊重各方面利益相关者的意愿，最终形成认同的教育行动方案，能充分听取各种意见和建议、充分调动各方面的积极性，更容易付诸行动而不是争吵，因而表现出其很大的优势。如何进一步完善、发展第四代评价方法，克服其在实践层面的操作的局限性，是今后努力的目标。

3.我国现行高等教育评价的理论与方法技术都有一个暗含的假设基础，即在评价发生的情境中存在着一个共同的价值体系，难以解决教育价值观多元化的问题。

我国现行高等教育评价理论与方法技术都有一个暗含的假设基础，即在评价发生的情境中存在着一个共同的价值体系。评价实践仍是用统一的参照系、统一的价值标准进行评价，对评价活动中价值基础的变化关注不够，难以解决教育价值观多元化的问题，反映不了社会对高等教育多样化、多层次的需要，这就难以发挥评价的服务功能而降低了评价的效用性。

4.解决我国教育评价的现实问题呼唤理论创新，转换评价范式成为不可避免的选择，只有在新的范式基础上探索我国教育评价的方法与技术才能推动我国教育评价的创新发展。

反思现有的研究，既有对已有教育评价模式的批判与改进，又有人们在评价实践中不断形成的各种经过改良的评价模式；既有对评价思想的反思，又有对评价方法技术的分析，但都无法解决评价实践中的争议性问题。多年的评价实践告诉我们，清晰的评价结论对教育活动的改进并没有达到人们的期望，对此我们不得不反思现行评价范式的科学性与可靠性。

在探讨如何有效提高高等教育评价的实效性的诸多文献中，一个显而易见的缺口在于，很少有学者将评价的理论和实践放在当今高等教育价值多元的背景下来加以考察。因此，尽管理论工作者和实践工作者都在进一步完善评价方法和技术，仍然不能解决高等教育评价中的争议问题。笔者认为，在当代多元价值的背景下，要提高评价的有效性，解决人们对高等教育评价的争议问题，必须转换传统的评价范式。我们探讨的不是评价的方法或技巧问题，而是高等教育价值多元化的今天，如何从宏观的角度重新审视评价范式及其操作模式。

基于以上认识和分析，本研究试图打破我国现行的基于价值预设、价值确定基础上的高等教育评价理论，围绕“价值多元”这一核心问题，以“回顾与梳理—反思与批判—建构—应用”为研究线索，寻求构建一种基于价值协商、价值认同的新的评价范式，并发展与建构新的评价范式语境中，适应中国高等教育运行环境的评价的价值协商机制。力图解决由价值观多元所带来的我国高等教育评价理论和实践中的众多矛盾和困惑，以期能够推进我国高等教育评价理论的发展，同时对我国高等教育评价实践的改革发挥指导作用。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈