心理评估的实施原则及注意事项

时间：2023-05-07 理论教育版权反馈

【摘要】：了解个体独特的发展过程将有助于探明心理问题形成的机制和原因。稳定性是心理评估中一直有争议的问题。除了在心理评估中要考虑发展因素外，被评估者心理问题的共生现象也是值得注意的。这种共生现象的高比例也决定了大多数心理评估必须是综合性的。除了发现问题之外，被评估者的心理机能的积极方面也有必要予以关注。心理测量量表选择的正确与否，直接影响评估的质量。

任务3　心理评估的实施原则及注意事项

一、心理评估的实施原则

（一）发展常模

在发展的背景下理解被评估者的心理机能和行为，首先要考虑发展常模。被评估者的许多行为是随着年龄而变化的，在某一个年龄段很普遍的行为，在其他年龄段可能相对就不普遍。例如对黑暗和想象中生物的恐惧感，在学前和低年级学龄儿童中相当普遍，但随着年龄增长这种感觉就逐渐减弱了。承认被评估者行为的发展变化对于心理评估是非常重要的，因为同样的行为在某一个年龄段属于发展正常范围内的指标，而在另一个年龄段却可能是病理指标。

被评估者的心理具有鲜明的年龄特征，因而在选择评估工具时应当考虑评估工具是否提供了适当的、特定的年龄常模。心理发展是不平衡的，有些心理机能或行为在某些年龄段发展变化较快，而在其他年龄段发展变化却相对平稳，年龄常模中年龄组的划分应能体现这一特点。正确利用发展常模所提供的信息对评估结果作出合理的解释，在心理评估中非常重要。

（二）发展过程

为了正确解释评估的结果，评价者还必须了解发展过程。发展过程包括两个方面，一是被评估者的一般发展过程，二是每个评估对象独特的个人发展史。

一般发展过程是指年龄阶段的发展。每个年龄阶段的发展都是一些相互联系的机能，如认知、情感、言语，或内因、外因相互作用的结果。每个年龄阶段都有特定的发展任务或发展需要，这种独特的发展需要导致了与年龄相关的发展变化。仅把被评估者的行为与年龄常模比较，并不能解释为什么一些行为在某些年龄段有明显的增多，不能确定它们究竟是正常发展过程的变形，或是与正常发展有质的偏离的病理发展过程的指标。

例如，对权威的反叛和质疑是青少年拒绝父母或社会价值的表现，这是青少年发展自我同一性过程中抗争的一种形式。当青少年第一次出现了这类行为问题时，最好把它看做是正常发展过程中的变形；而在青少年期之前儿童表现出这些行为问题时，也许就是比较严重的病理征兆。一些研究表明，有些行为问题发生在青少年期很可能是短暂的，而发生在青春期前则可能是较为严重的或长期的。

被评估者的个人发展史应包括个人在不同发展阶段的一般发展状况、既往病史和家庭史。了解个体独特的发展过程将有助于探明心理问题形成的机制和原因。

（三）发展的稳定性

稳定性指的是行为跨时间、跨情境的一致性。从发展的观点正确看待被评估者的心理特质和行为的稳定性是非常重要的。

稳定性是心理评估中一直有争议的问题。例如，有人对人格概念提出质疑，认为人格是指行为跨时间、跨情境的一致性特征，但实际上许多行为却并不具有这种一致性。儿童的行为较成人的就显得不稳定，许多行为测验证明了这一点。儿童期的飞速发展变化决定了儿童行为的稳定性相对低于成人的。然而儿童的一些行为仍是有一定的连续性的。稳定性的程度取决于所评价的心理机能和行为的类型，具体包括：评价了心理机能和行为的哪些方面；评价的是孤立的行为，还是行为不同维度的集合。例如，研究普遍表明，外化行为（如多动、攻击行为等）比内化行为（如恐惧、抑郁等）更为稳定，不同维度行为的集合体比孤立的行为更为稳定。另外，一些行为的不稳定性也许真实地反映了这样的事实，即不适应只是一种暂时现象，可能只是个体应对压力的一种发展性反应。

被评估者的行为在很大程度上与行为发生的背景有关。有人对119项研究进行了元分析，发现在有关儿童情绪和行为机能的报告中，不同评价者研究结果间的相关性非常低，仅为0.28（平均值）。然而这种低相关性并不是行为跨情境的特异性的很好指标，因为低相关性可能反映了不同评价者的个人偏见，而不是儿童行为跨情境的真实的差异。但是如果两个以上的观察者，如父母或两个教师在类似的情境中对儿童的评价相关性较高（如0.60以上），而在不同的情境中的评价相关性较低，则这种低相关性可能就是儿童行为跨情境的高度变异性的指标。

与跨时间的稳定性类似，跨情境的稳定性也与所评价的行为类型以及所评价的是行为的集合还是孤立的行为有关。例如，不同观察者所报告的外化行为的相关性高于内化行为的；母亲和教师所报告的关于儿童注意缺失的某一症状的相关性远低于两者所报告的达到诊断标准的有关注意缺失的一组症状的相关性。

正是由于考虑到发展的稳定性和变异性，对儿童的心理评估必须基于多种背景、多种信息源，这样才能作出综合的、客观的评价。

为了更好地理解儿童行为跨情境的变异性，在评价儿童心理特质与行为本身时，还要对许多重要背景如家庭、学校、同伴的相关方面进行评估，因为许多重要的环境因素都会影响儿童的行为。

（四）共生现象

除了在心理评估中要考虑发展因素外，被评估者心理问题的共生现象也是值得注意的。共生现象是一个生物学术语，这里借指同一个体的适应问题或心理障碍总是两个或更多的问题相继或同时出现，很少是孤立的单一问题。观察发现，有许多儿童经常会出现多方面问题，如情绪、学习、社交等。这种共生现象的高比例也决定了大多数心理评估必须是综合性的。心理评估不仅应跨越不同的背景，也应跨越不同的心理机能；不仅要评价学生、家长和教师所报告的问题，也应评价在适应中那些潜在的共生问题。有时可能会发现一些最初报告的问题其实并不是主要问题，一些症状可能会因其他共生问题而加重。

对共生条件的评价同样也很必要，因为有效的干预方案的设计需要多种参数。除了发现问题之外，被评估者的心理机能的积极方面也有必要予以关注。

二、心理评估的具体步骤

（一）准备阶段

（1）收集有关被评估者的基本情况。

（2）通过专门的描述问卷、直接询问有关人员、访谈、病史调查等途径描述被评估者现有的问题。

（3）选择适合被评估者情况的心理测量量表（评定量表）。心理测量量表选择的正确与否，直接影响评估的质量。评定量表一般均为纸笔形式，即一些表格和填表用笔，但少量他评量表有时还要求准备一些评定道具，尤其是评定儿童时，有时需要一些辅助器材（如玩具等），以备评定行为能力或特征性反应时使用。

（4）准备场地，一般在安静、光线充足的房间进行。

（二）实施阶段

在评定量表填表过程中，应填写被评估者的一般背景资料，如姓名、年龄、性别、职业、联系方式等。另外，评估者还应现场观察，包括被评估者各种行为、与不同人的相处情况、身体状况、环境的影响因素、完成任务时的依赖性等。评定量表分为以下两种。

（1）自评量表　各项目填写前应有简短的指导语，说明量表的主要目的、评定内容的范围、评定的时间界定、频率或程度标准，以及记录方法与其他要求等，最好是由评估者口头说明。量表的项目由被评估者自己填写，独立完成填表过程。自评量表一般作为团体评定工具，以10～20人为宜。

（2）他评量表　评估者一般要求是专业工作人员。评定的资料来源主要来自最了解被评估者日常生活情况的人（如其亲属、教师或者社区人员）。由评估者根据资料来源，对照评分标准进行评分。

（三）评定结果的解释和报告

对个体评估结果的报告，用语要简明扼要、重点突出、解释合理才有科学性。需要注意几个问题，如：常模比较；确定旧问题、发现新问题；解释为主、分数为次；按照与问题的相关程度有主次地报告。此外，以口头形式报告给被评估者个人或家属时，一般将专业性术语用较通俗化的语言表达，但要注意其科学性。

（四）提出建议

（1）先指出被评估者的优点，后讲其不足。

（2）围绕评估结果提出建议。

（3）建议一定要具体、可操作、有针对性。

三、心理评估的注意事项

（一）参照标准的统一

不同的评估者对于一些专业术语有不同理解，或一些专业术语本身概念就不统一，这会导致评定结果不一致。此外，评估者本身的性格特点、个人价值或主观愿望等，在评估时会缺乏客观性。

（二）资料来源的可靠

评估者对被评估者缺乏足够的了解，对某些行为或症状不能如实地判断，从而高估或低估了被评估者。另外，通过被评估者的亲属、教师及社区人员收集的资料，其出入往往也很大，这是由于他们的偏见或观察能力的差异引起的结果偏差。

实训　心理测量量表的使用

一、心理测量量表的选择

心理测量量表有很多种类：根据功能，分为能力、智力、潜力、特殊能力等量表；根据学习成就，分为各科目的学习能力、技能掌握情况量表；根据人格测验，分为态度、性格、情绪、气质量表；根据人数，可分为个别和团体量表；根据材料，可分为器具、文字量表；根据测量目的，可分为诊断、筛选等量表。此外，还可以根据使用时间的长短，选择内容翔实或者省时、经济的量表；为了使评估结果具有更好的客观性和真实性，也可选择标准化程度较高的量表等。因此，量表的选择一般是根据使用者的研究目的来进行的。

知识链接

标准化测验

标准化测验是经过一套严格的标准化程序进行编制，并按照标准化程序使用的测验。标准化是指测验的编制、实施、记分及测验分数解释程序的一致性。测验标准化才能获得真实的结果，各种测验依据标准化的完善程度各异。

标准化过程和内容如下。

（1）由专家选择编制统一的测验题。

（2）制定标准的测验指导语，规定时限和特定的测验环境。

（3）编写详细的评分标准与说明。

（4）有代表性的常模。

（5）检验测验项目的难度、区分度、信度与效度。

（6）编写测验手册，按统一的标准实施测验。

信度是指测验的可靠程度，即测验结果的一致性程度。通常用相关系数来表示。信度系数越高即表示该测验的结果越一致、稳定与可靠。系统误差对信度没有什么影响，因为系统误差总是以相同的方式影响测量值的，因此不会造成不一致性，但随机误差可能导致不一致性，从而降低信度。信度可以定义为随机误差（R）影响测量值的程度。如果R＝0，就认为测量是完全可信的，信度最高。

效度是指测验对要测量的东西能够测量的正确程度，即测量的正确性。效度是指所测量到的结果反映所想要考察内容的程度，测量结果与要考察的内容越吻合，则效度越高；反之，则效度越低。效度分为内容效度、准则效度和结构效度三种类型。

常模是判断个别差异的依据和比较的标准。它是心理测评用于比较和解释测验结果时的参照分数标准。测验分数必须与某种标准比较，才能显示出它所代表的意义。常模根据有代表性人群样本的测验结果制订。根据样本来源和大小划分，通常有全国常模、区域常模和特殊常模，根据具体应用标准和分数特征常模可分为平均数常模、百分数常模和标准分常模。

二、临床常用评定量表

（一）症状自评量表

（1）简介　综合评估被试者的自我感觉症状和心理状况的程度，对其自我精神状态进行客观评定，为精神科临床的诊断、治疗、护理及精神药理学研究提供科学依据。本量表适用于16岁以上的神经症、适应障碍及其他轻性精神障碍患者，也可用于个体心理健康状况的自我评定，可以评定一个特定的时间的情况，通常是评定一周以来的情况。

（2）评定方法　该量表分为五级评分（0～4级），0——从无，1——轻度，2——中度，3——相当重，4——严重。有的也用1～5级，在计算实得总分时，应将所得总分减去90。

（3）评价　症状自评量表包含比较广泛的精神病症状方面的内容，如思维、情感、行为、人际关系、生活习惯等。本量表在国外广泛应用，在国内应用于临床研究。

（二）自评抑郁量表和抑郁状态问卷

（1）简介　自评抑郁量表（SDS）用于成年人衡量抑郁程度及在治疗过程中的变化情况。1972年改自评为他评，称为抑郁状态问卷（DSI）。评定时间跨度为最近一周。

（2）评定方法　SDS和DSI分别由20个陈述句和相应问题条目组成。每一条目相当于一个有关症状，按1～4级评分。20个条目反映抑郁状态四组特异性症状：①精神性－情感症状，包含抑郁心境和哭泣两个条目；②躯体性障碍，包含情绪的日间差异、睡眠障碍、食欲减退、性欲减退、体重减轻、便秘、心动过速、易疲劳共8个条目；③精神运动性障碍，包含精神运动性迟滞和激越两个条目；④抑郁的心理障碍，包含思维混乱、无望感、易激惹、犹豫不决、自我贬低、空虚感、反复思考自杀和不满足，共8个条目。

每一个条目按1、2、3、4四级评分。20个条目中有10项是用正性词陈述的，为反序计分，其余10项是用负性词陈述的，按上述1～4级顺序评分。SDS和DSI评定的抑郁严重度指数计算公式为：抑郁严重度指数＝各条目累计分/80。该指数范围为0.25～1.0，指数越高，抑郁程度越高。

（3）评价　SDS和DSI为短程自评量表和问卷，使用方便，能直观反映抑郁患者的主观感受，有效反映抑郁状态的有关症状及其严重程度和变化，特别适用于综合医院发现抑郁症患者，但是对于严重阻滞状态的抑郁评定有一定的困难。

（三）焦虑自评量表（SAS）

与SDS十分相似，焦虑自评量表含有20个项目，分为4级评分，可用于评出焦虑患者的主观感受，适用于具有焦虑症状的成年人，具有较广泛的适用性。评定时间应强调是“现在或过去一周”。中国常模总分正常上限为40分，标准总分的正常上限为50分，标准总分越高焦虑症越严重。

（四）瑞文标准推理测验（SPM）

（1）简介　瑞文标准推理测验用于测量个体解决问题、观察、知觉和思维，以及发现和利用自己所需信息的能力，适用于5～70岁的普通人群，可团体施测，也可个别施测。测验时间为40min左右。

（2）评定方法　本测验分为A、B、C、D、E五组测验题，每组12题，共60题。五组的题目难度逐步增加，每组内部的题目是由易到难排列的。每组题目所用解题思路基本一致，而各组之间则有差异。A组题主要测知觉辨别力、图形比较、图形想象等；B组题主要测类同、比较、图形组合等；C组题主要测比较、推理、图形组合；D组题主要测系列关系、图形套合；E组题主要测图形套合、互换等抽象推理能力。

（3）评价　本测验适用于弱智儿童的筛查，使用简单，施测和记分程序简便，结果容易解释，适用的年龄范围广，测验对象不受文化、种族、语言及听力、肢体障碍的限制。信度和效度较高。

（五）斯坦福－比内智力量表（第五版）（SB－5）

（1）简介　本量表用于测量儿童、成人的智力，适用于2岁至成人期的普通人群，完成整套测验需要45～75min，属于个别施测的标准化智力测验。

（2）评定方法　整个测验分为言语领域和非言语领域两部分，每个部分均包括5个分测验，分别测量流体推理、知识（晶体能力）、数量推理、视觉－空间信息加工和工作记忆5个因子。施测分两个阶段进行：第一阶段施测言语知识和非言语流体推理分测验；第二阶段施测其他的分测验，根据受测者的应答情况确定他在每一个分测验上的基础水平和上限水平。大多数题目都按0或1记分，但也有一部分难度较大的题目按0、1或2记分。将每一题的得分加起来，就可以得到分测验的原始分数。将分测验的原始分数转换为平均分为10、标准差为3的量表分数之后，就可以计算5个因素指数和4个合成分数，即全量表IQ（智商）、言语IQ、非言语IQ和简缩版IQ（平均分＝100，标准差＝15）。简缩版IQ是用两个定位测验的分数计算得来的。此外，还可以将原始分数换算成百分等级和年龄当量。

（3）评价　该量表具有很高的内部一致性信度和效标关联效度，对认知能力的诊断和评估更全面，节省测试时间，适用年龄范围较广，是国际上使用最广泛的智力测验量表之一。

（六）生活事件量表（LES）

（1）简介　生活事件量表是自评量表，含有48项我国较常见的生活事件，包括三个方面的问题：①家庭生活方面（28项）；②工作学习方面（13项）；③社交及其他方面（7项）。另设有2项空白项目，供填写当事者自己经历过而表中并未列出的某些事件。该量表适用于16岁以上的正常人，神经症、心身疾病、各种躯体疾病患者以及自知力恢复的重性精神病患者。该量表可甄别高危人群，预防精神障碍和心身疾病，指导正常人了解自己的精神负荷，维护心身健康，提高生活质量，使心理治疗和医疗干预更具针对性。对于神经症、心身疾病、各种躯体疾病及重性精神病的病因学研究，可以确定心理因素在这些疾病发生、发展和转归中的作用分量。

（2）评定方法　填写者必须仔细阅读和领会指导语，将某一时间范围（通常为一年）内的事件记录下来。有的事件虽然发生在该时间范围之前，但如果影响深远并延续至今，则可作为长期性事件记录。对于量表上已列出但未经历的事件应一一注明“未经历”，不留空白，以防遗漏。由填写者根据自身的实际感受而不是按常理或伦理道德观念去判断那些经历过的事件，对本人来说是好事或是坏事？影响程度如何？影响的持续时间有多久？偶然性的事件如流产、失窃要记录发生次数。长期性事件如住房拥挤、夫妻分居等不到半年记为1次，超过半年记为2次。影响程度分为5级，从毫无影响到影响极重分别记为0、1、2、3、4分；影响持续时间分为一个月内、半年内、一年内、一年以上共4个等级，分别记为1、2、3、4分。

生活事件刺激量的计算方法如下：

某事件刺激量＝该事件影响程度分×该事件持续时间分×该事件发生次数

正性事件刺激量＝全部好事刺激量之和

负性事件刺激量＝全部坏事刺激量之和

生活事件总刺激量＝正性事件刺激量＋负性事件刺激量

还可以根据研究或诊断治疗需要，按家庭问题、工作学习问题和社交问题等进行分类统计。生活事件量表总分越高反映个体承受的精神压力越大。95%的正常人一年内的生活事件量表总分不超过10分，99%的正常人不超过32分。负性事件的分值越高表明对心身健康的影响越大，正性事件分值的意义尚待进一步研究。

（3）评价　该量表是评定生活事件的有效工具，甚至有人认为它可以用来检测其他生活事件量表的效度。

（七）家庭环境量表（中文版）（FES－CV）

（1）简介　该量表由费立鹏等人于1991年在美国心理学家Moss　R.H.编制的家庭环境量表（FES）的基础上修订改写而成。该量表含有10个分量表，从10个方面分别评价家庭、社会和环境特征，包括：①亲密度；②情感表达；③矛盾性；④独立性；⑤成功性；⑥知识性；⑦娱乐性；⑧道德宗教观；⑨组织性；⑩控制性。

（2）评定方法　该量表含有90个是非题，答题时间约30min，要求受试者具有初等以上教育程度。主试者应监控受试者完成量表的全过程，在受试者不能理解多个项目时应中止测试，并确认答卷无效。

（3）评价　该量表具有较好的效度和重测信度，但在内部一致性信度上有一定的问题。亲密度、矛盾性、知识性和组织性4个分量表的内部一致性信度较高；成功性、娱乐性和控制性3个分量表的内部一致性信度稍差；独立性、道德宗教观和情感表达3个分量表的内部一致性信度很差，可能是因为这些分量表的内容不太适合中国文化，故在应用该量表做解释时应该慎重。

（八）信任量表（TS）

（1）简介　该量表用于测试关系密切者的相互信任度，共有18个项目，涉及信任的三种内涵：可预测性、可依靠性和信赖。可预测性是指我们能否预见到同伴的特定行为，包括受我们欢迎的行为和不受我们欢迎的行为。量表作者认为凡行为能被预测者，其行为均具有连贯性（无论是一贯好还是一贯坏），而行为不可预测者则不能赢得人们的信任。可依靠性是信任最核心的成分。而信赖则“使人们能无保留地确信同伴将继续负起责任并关心自己”。

（2）评定方法　可根据受试者对每一项目的回答进行评分，有7个等级：1分表示完全不同意、7分表示完全同意。量表总分从18分（信任度最低）至126分（信任度最高），中间值为72分。整个量表的内部一致性a＝0.81，其中可预测性a＝0.82，可信赖性a＝0.80。3个分量表中度相关（范围在0.27～0.46之间）。Rempel等人描述了与本量表有关的许多变量，包括同伴间维持彼此关系的动机和内驱力，发现信赖对维持两人关系所起的作用大于其他因素的作用。

（3）评价　修订版信任量表包含了测试信任的核心——可依靠性的项目，但本量表更加侧重于一般性的对人性的信任。本量表的优势在于它以坚实的理论为基础。

（九）孤独量表（LRS）

（1）简介　这是一个多维量表，用于评价孤独者特殊情感的频度和强度。

（2）评定方法　由大学生在感到孤独时用以形容其情感体验的70个形容词组成。频度与强度描述标在每个题目旁。形容词的排序是随机的，通过因素分析将这70个形容词简化为4个分量表，即衰竭、孤立、激越与颓废，每个分量表含有10个词。分量表得分范围频度为0～30，强度为0～50。当频度为“从未有过”时，强度为0。

（3）评价　该量表针对的是孤独者的各种情感体验，而不侧重于人际关系。

（十）个人评价问卷（PEI）

本问卷用来评定自我评价的一个重要方面——自信。个人评价问卷共54个自陈条目，从六个方面考察了被测者的自信水平、学业表现、体育运动水平、外表、爱情关系、社会相互作用及人际关系。测验评定了总体自信水平和有可能影响自信判断的心境状态。本测验要求被测者年龄在16岁以上，具有小学以上的文化水平，没有可能影响测验结果的严重生理缺陷。

总量表分的重测信度的相关系数为：女性0.90，男性0.93。个人评价问卷与Rosenverg自尊量表的相关系数为0.58，与Janis及Field的缺陷感量表的相关系数为0.59。

能力检测

1.什么是信度？什么是效度？什么是常模？

2.心理评估的种类有哪些？

3.心理评估的环节有哪些？

4.心理评估的原则是什么？

（曾　姝）

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈