研究的内部效度

时间：2023-02-28 百科知识版权反馈

【摘要】：为了保证研究的“内部效度”，通常采用随机分配被试组别来操作“自变量”，以增加因果关系结论的力度。“非实验设计”的不足之处在于“内部效度”较难控制。基于研究的设计，调查的结果实际上存在多种变化的解释。最后，研究人员通过测量“因变量”来决定其产生的差异程度。所以，在体育社会心理学研究中，“实验设计”应用得较少。

研究的内部效度_当代体育社会心理探索：从理论到实践

3.5　研究的内部效度

为了提供对理论的有效测试，研究必须反映“自变量”对“因变量”的确切效应。但是，如果在研究中同时测试“自变量”与“因变量”，其“内部效度”则会受到一定的影响。一般地讲，一个好的理论测试可以提供可靠的因果关系证据。研究“内部效度”的可靠性在于我们有多大的把握预测“自变量”可以引起“因变量”的变化。为了保证研究的“内部效度”，通常采用随机分配被试组别来操作“自变量”，以增加因果关系结论的力度。因此，研究设计怎样选择被试对于提高“内部效度”具有一定的意义。

在体育社会心理学研究中，“内部效度”的主要威胁来自非测试因素的影响。但是，排除这些因素影响通常有一定难度。以Kalin和Berry在1982年的一个社会心理学研究为例。该研究测试Allport在1954年提出的“接触假设”理论，即不同种族成员的友好相处可以增加相互的同化。研究设计为不同种族的邻居交往作为诱因变量，运用公众观点的调查，分别对加拿大的英裔、法裔、美裔、德裔、意裔等居民进行问卷访问。他们比较了住在同一地区的加拿大人种普查数据信息，并作为不同调查研究的反映依据。结果表明，住在接触率相对高的地区居民的同化程度要高于分散的区域。该研究以一个“非实验设计”（nonexperimental research design）完成，表现为同时测试“自变量”（邻居的种族分类区域）和“因变量”（被试的观点）。“非实验设计”的不足之处在于“内部效度”较难控制。例如，该研究调查的“自变量”测试设计实际上选择基于法语区被试与非法语区被试。这样，研究人员很难排除这两组中被试的其他未知成分。虽然调查发现法语区的居民组总体效应不同于其他组，但研究人员并不能十分肯定这种差异的起因，因为他们不能排除其他增加接触的因素可能成为诱因的解释。基于研究的设计，调查的结果实际上存在多种变化的解释。一方面接触引起同化，但另一方面同化也可能会引起接触。也就是说，一些居民如果在意识上倾向认同，也可能会选择留在一个同化较高的区域居住。另外，如果一些人在性格方面相同，也可能会认同相似的社会背景，并选择其作为邻居。这样，研究人员就很难确定测试的效应是由于哪一种诱因。在“非实验设计”中，作为“自变量”的被试总是可能以意想不到的方式反映出存在的差异。这些被试表现出来的差异给研究测试结果提供了另外的解释。而这些额外的解释对于研究“因变量”的效应来说，则又多了一个“内部效度”的威胁。

由于人类学的特征存在着许多差异，在研究的设计中是否可能预先将这些因素进行确认呢？答案是肯定的。这可以通过“实验设计”来实现。关于“实验设计”，需要从两个方面来注意“内部效度”：一是被试的分配要做到随机性（也就是实验的条件）。研究中被试的随机分配主要指从一个大的被试样本随机地选择出来。二是随机分配后，“自变量”应该是“操作”，而不是测试。

具体的设计步骤为：首先，从设计上讲，通过抛掷钱币的形式，随机地把被试分成相等的组，让各组内的每个被试都具有同等的机会。例如，20个被试，10男10女，通过抛掷钱币形式随机地将他们分成两组。抛掷钱币的随机决定是否可能产生一组全为男性？这当然可能，但应该说概率非常小。因为钱币的每面出现各占一半的机会。这样，每组可以大约分配到男女相等的被试。在研究中，一些不能测试的特征（如年龄、文化程度、人种等）同样可以用类似方法进行随机分配。

实验设计的第二步是操作“自变量”，使被试在不同的条件下接受实验干预。由于各组被试具有同样的初始状况，这种干预过程只能在“自变量”上产生差异。最后，研究人员通过测量“因变量”来决定其产生的差异程度。这种在“因变量”上出现的前后差异可以有足够的理由说明“自变量”引起的效应。一般来讲，一个好的操作设计能够在预期的理论结构基础上观察到“自变量”与“因变量”间的唯一效应。例如，Desforges等在1991年运用“实验设计”同样测试了“接触假设”理论。他们把被试随机地分成两组，在同一环境下，要求一组被试交谈式地帮助一个由研究人员扮演的“心理病人”，而另一组则只是与该“心理病人”静坐。结果发现，提供帮助的被试比没有提供帮助的被试对“病人”产生更积极的态度。在研究的设计方面，通过随机分配被试，施以不同的“接触”，由此产生的因果效应，其效度能够得到保证。一般地讲，“实验设计”具有相对好的“内部效度”，更适合用于测试结构间的因果关系。“非实验设计”采用“自变量”与“因变量”同时测试，所得结果即使是与诱因理论一致，其支持理论的力度也不及“实验设计”的研究。这是因为其他的未知因素也可能对我们观察到的结果产生作用。相比之下，由于随机组合和操作“自变量”能够较好地排除其他效应解释的可能性，“实验设计”的研究提供了更有力的测试理论结果的支持证据。

但是，既然“实验设计”的研究明显优于“非实验设计”的研究，为什么在当今的社会心理学研究中，仍然有许多“非实验设计”的研究呢？原因很简单：一是自变量随机选择的过程，或者“实验设计”的被试随机分配不仅总是会受到选择样本定义的限制，而且在分析单元、概念测试、地点、时间方面的选择都受到一定的限制。例如，一些很重要的理论自变量（如性别、人种、居住区等）必须测试，但又不能被人为操作改变。二是对于涉及人权的问题，研究人员不可能进行操作设计。例如，对于运动员的兴奋剂问题、非道德体育行为问题等，这些自变量的操作都有一定的难度，只能选择“非实验设计”来进行探索。三是对于有的社会问题研究，“实验设计”的操作距离现实生活太远，难以反映“真实的社会环境”，如果采用“实验设计”的操作，不但无法保证研究的“内部效度”，还会使研究的实用性下降（见表3-1）。所以，在体育社会心理学研究中，“实验设计”应用得较少。

表3-1　实验设计与非实验设计的优势与劣势对比