首页 百科知识 研究的外部效度

研究的外部效度

时间:2022-02-28 百科知识 版权反馈
【摘要】:所以,不希望世界上所有的人对“心理问题”抱有同样的看法,而是希望找到同组内成员友好互动改变信念和态度相似的过程,至少希望通过进一步研究揭示理论应用的限制。如果研究的外部效度好,它的结论应该适合其他相关理论的被试类型、时间和地点。然而,这些研究的结论却
研究的外部效度_当代体育社会心理探索:从理论到实践

3.6 研究的外部效度

研究的外部效度问题是我国体育心理学研究人员最容易忽略的问题。正如我们目前所看到的,在我国许多体育学术期刊中,有关心理学的研究论文与国外的同类文章相比,其最大的区别是前言对研究的介绍几乎是少得不能再少(当然,部分也可能是期刊的要求)。许多必要的理论背景信息都被省略掉了。这样做的结果是,读者不清楚研究外部效度怎样,使研究的实际价值大打折扣。为什么要这样说呢?下面我们来进一步地讨论这个问题。

为了提供理论的有效测试,研究必须要有外部效度。这意味着研究的结果可以适用于不同的人群、情景和时期。在一般情况下,有的理论可以用于不同类别的人群和地点,但是有的理论则只能用于一些特殊场合。当应用一个理论到具体的样本和情景时,外部效度是研究首先要考虑的问题。从另一个方面讲,当应用不同样本、地点和情景归纳一个理论时,外部效度的确认是通过不同样本、情景和文化的重复测试来验证的。

一个研究通常是采用一个类型的被试在一个单一的时间或单一的地点来完成的。这样,如果研究的结果要被推而广之,就存在一个外部效度的问题。也就是说,另外的被试、时间、地点是否也适合相关的理论。例如,Desforges的研究结果提供一个数据支持“接触假设”。但是,我们可能想知道这些结果是否只能适合北美地区的人群,还是只能适合心理病人?研究的主要功能之一就是要决定理论适用的广度。基于我们前面的讨论,一个理论适用的范围越广,解释力度越大,就越具有价值。但是,并不是所有的理论都要求解释所有情况下的所有群体。在一些研究中,研究人员主要关注的是一个具体靶样本和情景。这样的情况通常被称为“应用研究”,也就是说,研究的目的是运用科学的发现解决实际的问题。例如,社会心理学研究表明团队凝聚力可以改善人际关系,促进工作效益的提高。运动心理学研究人员可能希望知道是否团队凝聚力可以增加运动员与教练员之间的和谐关系,从而影响运动成绩。那么,通过设计一个具体相关样本和情景的研究,研究人员可以回答这一问题。在该研究中,只有运动员和教练员才能作为被试。事实上,对于给定的运动员和教练员被试来说,研究结果表明团队凝聚力不仅可以促进运动员与教练员关系和谐,而且还能提高运动成绩(Carron,Hausenblas,and Eys,2005)。

有的研究并不是针对一个单一具体的样本和情景,而是更广泛的多因素范围。有效解决这类研究的方法是不断地提出问题:“研究是否包含不同类型的被试?”“研究是否可以应用于男性被试,还是只能应用于女性被试?”“研究应用的被试是否适合现阶段?”“2020年以后会怎样?”等等。在通常的情况下,研究都是运用有限数量的特定被试在一定范围和一定时间来完成的。但在实际应用中,很少有人对研究结果只能应用于这些特定的被试、时间和地点感兴趣。所以,关键的问题是:研究结论的哪些方面才是真正可以被成功地归纳出来的?

现在让我们再回到Desforges的研究。北美大学生在实验室里与他(她)们相信有“心理问题”的人进行合作任务的学习。这些学生中的一组在见到“心理问题”的人以前,就对事物抱有肯定的信念。假设研究已经通过结构效度和内部效度的检验,那么这样的发现意味着什么呢?我们也许会问这个同样的发现会出现在中国的大学生中吗?会出现在成年人中吗?然而,社会心理学研究人员却很少研究参与样本的多样性。实际上,对于这些被试来说,关注他(她)们对“心理问题”看法并没有意义。也就是说,是否可以直接归纳该研究的具体发现并不是关键的问题。这是因为对于推广性归纳来说,这样的问题并不准确。

那么,什么是适合的归纳推演呢?要回答这个问题,首先让我们来回顾Desforges研究的基本理由。该研究的目的既不是归纳特殊的靶样本,或者是具体的背景,也不打算揭示人们对“心理问题”看法的兴趣(也就是该研究的因变量)。而研究的真正目的是测试一个因果关系理论的抽象结构。在该案例中,理论描述了在具体条件下,团体成员间的友好互动通常会引起人们对组内成员相互间的态度和信念向着积极的方面改变。这一理论的层面才是研究人员希望概括的。所以,不希望世界上所有的人对“心理问题”抱有同样的看法,而是希望找到同组内成员友好互动改变信念和态度相似的过程,至少希望通过进一步研究揭示理论应用的限制。研究人员希望把理论从一个样本和情景推演到另一个样本和情景。如图3-2可以表示这样的理念:一个研究结果不是直接应用到另一个样本或情景,而是用于支持一般理论,这样就包含了另一些人群和情景(Smith and Mackie,2000)。

如果研究的外部效度好,它的结论应该适合其他相关理论的被试类型、时间和地点。而被试的类型对理论的推广会首先构成威胁。主要的问题是研究所用的被试可能并不能代表所有理论拟应用的类型。例如,学生在许多方面都不同于一般意义上的人。与成年人相比,学生倾向更年青,更具有知识,可能对稳定密切关系的需求更少。他(她)们正处在形成新的社会角色和自我意象的阶段,并且可能更少拥有疾病、离婚和为人父母的体验。所以,研究人员可以基于学生被试的研究结果推广到一般人群吗?答案是明显的:当然不行。

img8

图3-2 研究理论应用过程

但是,正如我们提到的,研究人员的初衷并不希望概括具体的发现。通常的目标是概括因果过程的更广的结论。例如,我们在完成一个运动员与教练员关系的研究,我们并不希望找到男性运动员和女性运动员与教练员之间的关系不和谐的具体问题所在,而是关注这些不和谐的效应作用于运动员对关系的满意度可能在男、女运动员中是相似的。再如,学生不像成年人那样发展了较完善的社会角色,但是他(她)们自我观点的形成过程和这些观点作用行为的效应可能与其他群体相类似。这样,在因果解释方面概括更倾向于在思维与行为方面的调节。

需要指出的是,不同类型人群中最有可能雷同的社会心理过程往往是最基本的过程。研究表明,这些过程包括人们反应社会影响的方式、运用最有效的信息、寻求征服自身的环境,以及社会关系的发展等。社会心理学家常常运用学生被试对这些过程进行研究,主要原因是这些被试比较容易获得。然而,这些研究的结论却很少能被推演到不同类型的被试群中进行重复验证。所以,现阶段即使是一些最基本的过程结论也没有被概括推广。

人类学家的观察证明,人们在不同的国家生活会运用不同的社会行为方式。对于西方的社会心理学家来说,主要是研究西方的社会现象。那么,他们的研究结论可以引用到东方的社会和文化吗?这个问题的答案只有通过对我们希望应用的结论在具体情景中进行测试才能找到。这是因为人们在观察过程中通常会带有一定的期望,或者是对其他社会群体固有看法的“刻板定式”。亚洲国家在“刻板定式”上与西方国家不同,但这些国家的“刻板定式”在发展中逐渐地倾向一致,使其带有“亚洲人群”的定式。在这个定式中表现出来的是“亚洲文化”。

文化强烈地表述了人们的思想和行为。东西方人群在文化方面表现出来的内容和过程都是不同的。所以,这些发展运用的内容与过程很可能被概括。例如,西方人特别可能认为自己与他人是分离的,并习惯定义自己的“唯一性”。然而,在东方,人们倾向于认为自己与他人是有联系的,并看重人际关系(Markus,Kitayama,Heiman,1996)。自我概念上的差异会导致东西方人群在自我信息过程、社会反应,以及情绪体验方面都有不同的行为方式。所以,任何有关这方面题材以单一文化构建的理论与验证都不能推演到另一文化的人群。

另外,如同我们前面提到的,被试的代表性是限制应用的因素之一。除此之外,研究的背景或地点也是影响因素。在这方面,实验室与实地研究都有各自的优缺点。许多社会心理学研究是在实验室完成的,因为研究人员需要控制条件。在实验室中,研究人员可以把被试随机地分配到不同的条件,在应用结构变量测试因变量,并保持其他因素不变的同时,操作独立变量。实验室情景的准确性在于其有较高内部效度的设计。

但是,实验室在效应作用过程的时间方面显得较短。而且,许多实验室研究在操作和测试方面不同程度地会带有人工的成分。例如,在实际的情景中要测试社会帮助合作通常有一定难度。研究人员只能通过实验室来假设一个情景,在实验中可能会要求被试给予另一假设的伙伴积分来测试帮助的概念。然而,这样研究的社会真实性就不得不受到影响。

另一个外部效度潜在的不足是被试可能更多地关注实验室提供的信息,而忽略了其他的内容。例如,研究有关说服的试验,被试阅读一个说服的信息,然后测试他(她)们的态度。不同的信息可能或多或少地显示不了不同的效应。但是,在实际的说服交流中人们是不需要阅读的。在实际生活中,任何说服信息的效益都取决于注意的能力。所以,当实验室与非实验室的情景操作过程不同时,实验室中支持理论的结论可能并不适合非实验室的情景。

最后,实验室情景的缺点是参与研究可能产生一个具体的动机。当人们知道自己被研究时,他(她)们可能想知道“研究人员想获得什么”。这样,研究目的的认知就可能会作用于被试的行为。这种基于被试对研究目的认知的行为被认为是受到“要求特征”(demand characteristics)的影响,会威胁研究的结构效度。这是因为在被试的印象中希望满足研究人员想要的结果,使得实验的成分可能作用于被试的行为,而不是内部效度作用于被试的行为(Orne,1962;Rosencher,1969)。当研究在一个陌生的新环境中进行时,被试会对被告知希望的行为暗示变得更加敏感。这种作用在Rosenthal等1963年的研究中表现得非常明显。当让被试判断一个连续成功与失败的脸谱时,他(她)们的行为表现明显受到了研究人员的暗示。在该实验中,研究人员引导一组被试相信展示的照片是“成功”的脸。第二组被试被引导相信这些同样的照片是“失败”的脸。两组实验运用同样的过程和引导语。尽管告知被试照片并没有任何含义,被试仍然会非常仔细地抓住研究人员的非语言行为。在两组中,被试在评估照片时与研究人员的期望非常一致。由于被试的行为不仅反映意向的结构(即照片的认知),而且也反映要求的特征(也就是研究人员似乎希望的反应)。该研究显示了结构效度是怎样被影响的完整过程。

为了减少“要求特征”的效应,研究人员通常训练一些与被试接触的研究小组。这些小组成员并不真正知道研究的目的。这样,小组的成员不可能影响被试的期望。另外,研究人员通常会试图隐藏真正的研究目的,有时甚至有意误导被试。总之,尽管这些措施有一定的效果,但任何实验室的研究都可能会受到“要求特征”的影响。

正是基于这些考虑,许多社会心理学研究人员没有放弃非实验研究。所谓非实验研究也指实地研究。实地研究的一个优点是关系发展中变量间有一个长期的效应,并容许研究人员测试实在的、有说服力的变量。例如,通过观察学生献血行为来测试社会帮助行为要比实验室假设帮助行为更具有说服力。还有的社会现象研究在实验室中是不可能模拟出来的。例如,研究运动员退役过程中心理反应等问题,对于这些问题的实地研究显得非常有效,并有较好的结构效度:研究所用的变量能够很好地与理论的结构一致。对于实地研究来说,避免了控制具体过程,这样会减少“要求特征”的效应。但是,这并不意味着非实验研究总是比实验研究具有更好的外部效度,这一种情景下完成的研究可能并不能推演到另一种情景。所以,如何确认外部效度就显得很重要。表3-2总结了三种效度的重要特征。

总体上讲,获得外部效度的关键取决于研究的目的。

如果研究目的是为了概括一些具体靶样本和情景,被试与情景必须具有该样本的代表性。例如,研究的目的是寻求伤残人员体育锻炼态度如何受医务监督人员行为的影响,选择一个康复医院作为研究是最为适合的。

如果研究目的是为了概括到不同人群、地点、时间,最好的方法是运用包括不同文化的综合样本和背景进行重复研究。在社会心理的研究中文化的变量应该融入理论中,以解释不同文化的社会行为,而不仅仅是描述。目前,越来越多的研究基于不同文化的背景,从而发展和测试了许多更为广义的解释理论。这也是21世纪社会心理学研究发展的方向(Smith and Mackie,2000)。

表3-2 理论性质与三种研究效度相适应的特征

img9

总之,结构效度、内部效度、外部效度反映了研究过程的不同方面,并且受不同的因素影响。所以,要采用不同策略来保持研究的效度。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈