首页 百科知识 研究的内部效度

研究的内部效度

时间:2022-02-28 百科知识 版权反馈
【摘要】:为了保证研究的“内部效度”,通常采用随机分配被试组别来操作“自变量”,以增加因果关系结论的力度。“非实验设计”的不足之处在于“内部效度”较难控制。基于研究的设计,调查的结果实际上存在多种变化的解释。最后,研究人员通过测量“因变量”来决定其产生的差异程度。所以,在体育社会心理学研究中,“实验设计”应用得较少。
研究的内部效度_当代体育社会心理探索:从理论到实践

3.5 研究的内部效度

为了提供对理论的有效测试,研究必须反映“自变量”对“因变量”的确切效应。但是,如果在研究中同时测试“自变量”与“因变量”,其“内部效度”则会受到一定的影响。一般地讲,一个好的理论测试可以提供可靠的因果关系证据。研究“内部效度”的可靠性在于我们有多大的把握预测“自变量”可以引起“因变量”的变化。为了保证研究的“内部效度”,通常采用随机分配被试组别来操作“自变量”,以增加因果关系结论的力度。因此,研究设计怎样选择被试对于提高“内部效度”具有一定的意义。

在体育社会心理学研究中,“内部效度”的主要威胁来自非测试因素的影响。但是,排除这些因素影响通常有一定难度。以Kalin和Berry在1982年的一个社会心理学研究为例。该研究测试Allport在1954年提出的“接触假设”理论,即不同种族成员的友好相处可以增加相互的同化。研究设计为不同种族的邻居交往作为诱因变量,运用公众观点的调查,分别对加拿大的英裔、法裔、美裔、德裔、意裔等居民进行问卷访问。他们比较了住在同一地区的加拿大人种普查数据信息,并作为不同调查研究的反映依据。结果表明,住在接触率相对高的地区居民的同化程度要高于分散的区域。该研究以一个“非实验设计”(nonexperimental research design)完成,表现为同时测试“自变量”(邻居的种族分类区域)和“因变量”(被试的观点)。“非实验设计”的不足之处在于“内部效度”较难控制。例如,该研究调查的“自变量”测试设计实际上选择基于法语区被试与非法语区被试。这样,研究人员很难排除这两组中被试的其他未知成分。虽然调查发现法语区的居民组总体效应不同于其他组,但研究人员并不能十分肯定这种差异的起因,因为他们不能排除其他增加接触的因素可能成为诱因的解释。基于研究的设计,调查的结果实际上存在多种变化的解释。一方面接触引起同化,但另一方面同化也可能会引起接触。也就是说,一些居民如果在意识上倾向认同,也可能会选择留在一个同化较高的区域居住。另外,如果一些人在性格方面相同,也可能会认同相似的社会背景,并选择其作为邻居。这样,研究人员就很难确定测试的效应是由于哪一种诱因。在“非实验设计”中,作为“自变量”的被试总是可能以意想不到的方式反映出存在的差异。这些被试表现出来的差异给研究测试结果提供了另外的解释。而这些额外的解释对于研究“因变量”的效应来说,则又多了一个“内部效度”的威胁。

由于人类学的特征存在着许多差异,在研究的设计中是否可能预先将这些因素进行确认呢?答案是肯定的。这可以通过“实验设计”来实现。关于“实验设计”,需要从两个方面来注意“内部效度”:一是被试的分配要做到随机性(也就是实验的条件)。研究中被试的随机分配主要指从一个大的被试样本随机地选择出来。二是随机分配后,“自变量”应该是“操作”,而不是测试。

具体的设计步骤为:首先,从设计上讲,通过抛掷钱币的形式,随机地把被试分成相等的组,让各组内的每个被试都具有同等的机会。例如,20个被试,10男10女,通过抛掷钱币形式随机地将他们分成两组。抛掷钱币的随机决定是否可能产生一组全为男性?这当然可能,但应该说概率非常小。因为钱币的每面出现各占一半的机会。这样,每组可以大约分配到男女相等的被试。在研究中,一些不能测试的特征(如年龄、文化程度、人种等)同样可以用类似方法进行随机分配。

实验设计的第二步是操作“自变量”,使被试在不同的条件下接受实验干预。由于各组被试具有同样的初始状况,这种干预过程只能在“自变量”上产生差异。最后,研究人员通过测量“因变量”来决定其产生的差异程度。这种在“因变量”上出现的前后差异可以有足够的理由说明“自变量”引起的效应。一般来讲,一个好的操作设计能够在预期的理论结构基础上观察到“自变量”与“因变量”间的唯一效应。例如,Desforges等在1991年运用“实验设计”同样测试了“接触假设”理论。他们把被试随机地分成两组,在同一环境下,要求一组被试交谈式地帮助一个由研究人员扮演的“心理病人”,而另一组则只是与该“心理病人”静坐。结果发现,提供帮助的被试比没有提供帮助的被试对“病人”产生更积极的态度。在研究的设计方面,通过随机分配被试,施以不同的“接触”,由此产生的因果效应,其效度能够得到保证。一般地讲,“实验设计”具有相对好的“内部效度”,更适合用于测试结构间的因果关系。“非实验设计”采用“自变量”与“因变量”同时测试,所得结果即使是与诱因理论一致,其支持理论的力度也不及“实验设计”的研究。这是因为其他的未知因素也可能对我们观察到的结果产生作用。相比之下,由于随机组合和操作“自变量”能够较好地排除其他效应解释的可能性,“实验设计”的研究提供了更有力的测试理论结果的支持证据。

但是,既然“实验设计”的研究明显优于“非实验设计”的研究,为什么在当今的社会心理学研究中,仍然有许多“非实验设计”的研究呢?原因很简单:一是自变量随机选择的过程,或者“实验设计”的被试随机分配不仅总是会受到选择样本定义的限制,而且在分析单元、概念测试、地点、时间方面的选择都受到一定的限制。例如,一些很重要的理论自变量(如性别、人种、居住区等)必须测试,但又不能被人为操作改变。二是对于涉及人权的问题,研究人员不可能进行操作设计。例如,对于运动员的兴奋剂问题、非道德体育行为问题等,这些自变量的操作都有一定的难度,只能选择“非实验设计”来进行探索。三是对于有的社会问题研究,“实验设计”的操作距离现实生活太远,难以反映“真实的社会环境”,如果采用“实验设计”的操作,不但无法保证研究的“内部效度”,还会使研究的实用性下降(见表3-1)。所以,在体育社会心理学研究中,“实验设计”应用得较少。

表3-1 实验设计与非实验设计的优势与劣势对比

img7

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈