首页 百科知识 变量间的关系

变量间的关系

时间:2022-10-21 百科知识 版权反馈
【摘要】:对于统计相关而实际无关的情况被称为虚假相关。对于定序以上层次的变量来说,变量与变量之间的相关关系还有方向问题,可以分为正相关与负相关两个方向。正相关关系中两个变量的取值变化具有同方向性。变量与变量之间相关关系的强度是指变量之间相关程度的强弱或大小。值得注意的是,对于社会现象来说,相关系数的值不可能达到1(或-1),也即是说,在社会研究中不存在完全的正相关或负相关。
变量间的关系_现代社会调查方法

一、变量间的关系

在现实生活中,社会现象之间的关系是复杂的,彼此相互联系、相互影响、相互依存,这种现象在统计分析中就构成了变量关系。变量关系从不同的角度分析,可以有不同的类型。从数量上看,变量关系可以分为两个变量之间的关系和两个以上的多变量之间的关系。从变量关系的性质看,可以区分为相关关系和因果关系,从变量关系的形态看,可以区分为直线关系与曲线关系。此外还有虚假相关与中介相关等等。在通常情况下,多个变量之间的关系可以分解还原成若干个双变量间的关系。因此,这里主要介绍两个变量之间的相关关系与因果关系

1.相关关系

(1)相关关系的概念。所谓相关关系,是指两个或更多变量之间存在的不确定的相互依存关系。相关关系具有对称性,即当其中一个变量发生变化时,另一个变量也随之发生变化;反过来也一样。比如,人们的社会地位与收入水平之间通常具有相关性,即当人们的社会地位相同时,其收入水平也大致相同,反之亦然。因此我们说这两个变量之间,存在着某种相关关系。用假设的语言表达,就是“人们的社会地位”(变量X)与“人们的收入水平”(变量Y)之间存在着相关关系。

相关关系用符号表示为:X→Y

需要指出的是,这里所说的相关关系,是指在统计上相关的两变量之间在实质上也存在相互影响的关系。在科学的统计条件下,统计相关能够比较准确地反映事物之间的真实相关,但二者之间不能简单等同。也就是说,两个在统计上无关或弱相关的变量,在实际上可能的确无关,也可能有关;两个在统计上相关的变量,在实际上可能有三种情况:无关、有关、因果关系。对于统计相关而实际无关的情况被称为虚假相关。只有统计相关并且在实际上也相关的变量关系才是真正的相关关系。

(2)相关关系的方向。对于定序以上层次的变量来说,变量与变量之间的相关关系还有方向问题,可以分为正相关与负相关两个方向。如果具有相关关系的两个变量之中,一个变量的取值增加时,另一个变量的取值也随之增加,或者随着一个变量取值的减少,另一个变量的取值也随之减少,这两个变量之间的关系就是正相关关系。正相关关系中两个变量的取值变化具有同方向性。例如,当我们调查发现,人们的社会地位(变量X)越高,他们的收入水平(变量Y)也越高;反之,那些收入水平较低的人,他的社会地位也较低,这时我们就说,人们的社会地位与人们的收入水平之间存在着正相关关系。

在两个变量之间关系中,当一个变量的取值增加时,另一个变量的取值反而减少,这种相关关系即为负相关关系。负相关关系中,两个变量的取值变化具有反方向性。例如,我们在调查中发现,妇女受教育年限越多时,她们所希望生育的子女数目越少;而那些希望生育孩子数目越多的人,她们的受教育年限也越少。由此我们可以断定,在妇女的受教育年限与妇女期望生育的子女数目之间,存在着某种负相关关系。

(3)相关关系的强度。变量与变量之间相关关系的强度是指变量之间相关程度的强弱或大小。双变量的统计分析中的相关分析就是用统计的方法测量和比较这些变量之间的相关程度,在统计学上称为相关系数。根据变量层次的不同,有各种不同的相关系数,但这些相关系数的取值范围一般都在-1到+1之间(-1≤r≤1),或者在0与1之间(0≤r≤1)。这里的正负号表示的是相关关系的方向,而实际的数值则表明相关关系的强弱。相关系数的值越接近0,意味着两变量相关的程度越弱;而相关系数的值越接近于1(或-1),则意味着两变量相关的程度越强。

值得注意的是,对于社会现象来说,相关系数的值不可能达到1(或-1),也即是说,在社会研究中不存在完全的正相关或负相关。另外,相关系数只是用来表示变量间相关程度的量的指标,它不是相关量的等单位度量,不能进行算术计算。例如,不能认为0.50的相关系数是0.25相关系数的两倍,只能说相关系数为0.5的两个变量之间的关系程度比相关系数为0.25的两个变量之间的关系程度更密切。

(4)相关关系的类型。从变量变化的表现形式上分,可以将相关关系分为直线相关与曲线相关。所谓直线相关,指的是当变量X值发生变动时,变量Y的值也随之发生大致均等的变动。并且在直角坐标系中,每对X、Y的值所对应的点分布呈直线状趋势。而曲线相关则没有这样的特征。在图10-3中,散点图(a)、(b)、(c)都是直线相关的例子,散点图(e)、(f)则是曲线相关的例子,而散点图(d)则属于0相关,即没有表现出相关的趋势。

img133

图10-3 散点图

2.因果关系

(1)因果关系的概念。因果关系是两个变量之间一种单向的、不对称的、在发生时间或逻辑顺序上有先后的一种特殊的相关关系。在这种关系中,其中一个变量变化时(取不同的值)会引起或导致另一个变量也随之发生变化(取值也不同);但反过来,当后一变量变化时,却不会引起前一变量的变化。在这种情况下,我们称变化发生在前面,并且能引起另一变量发生变化的那个变量为自变量(常用X表示);而称变化发生在后面并且这种变化是前面变量的变化所引起的那个变量为因变量(常用Y表示)。例如,吸烟可以引起肺癌,而肺癌不会导致吸烟。

因果关系用符号表示为:X→Y

(2)因果关系的三个条件。因果关系是事物规律的最准确反映,社会调查的最重要任务就是要寻找事物之间的因果关系。但社会现象非常复杂,通常都是表现为相关关系,很难直接发现其因果关系。社会调查只能从各种统计相关中寻找可能存在的因果关系。相关关系与因果关系有一定的联系,但二者并不是一回事。如果变量X与变量Y之间存在因果关系,那么它们之间必定存在相关关系。但如果两个变量之间存在相关关系,它们之间未必存在因果关系。那么,如何从相关关系中找到自变量(X)和因变量(Y),从而确定它们之间的因果关系呢?关键是要抓住以下三个条件,才能判定它们之间是否存在因果关系。

第一,变量间关系的不对称性。即变量X与变量Y之间存在着不对称的相关关系:当变量X发生变化时,变量Y随之发生变化,而变量Y发生变化时,变量X并不随之发生变化。这种不对称的相关关系,是因果关系成立的基础。比如,当调查资料表明人们的受教育年限与其年收入水平存在相关关系时,我们可能相信前者是后者的原因。因为人们受教育水平越高时,越容易找到报酬较高的职业,因而其年收入水平也可能越高;但反过来,随着人们收入水平的提高,不一定会导致人们受教育年限增加。

第二,变量间关系的时序性。即变量X与变量Y在发生的时间顺序上必须有先后之别:作为原因变量的自变量必须变化在先,作为结果变量的因变量必须变化在后。如果两个变量的变化同时发生,分不出先后,则不能成为因果关系。例如夫妻对婚姻的满意度与夫妻交流时间的多少这两个变量之间在统计上有一定相关性,但我们并不能肯定夫妻对婚姻满意程度的提高发生在交流时间增加之前,因为也可能是夫妻交流时间的增加导致了夫妻对婚姻满意程度的提高。

在特殊情况下,两变量间虽然无法确定存在的时间先后顺序,但仍然可以确定二者之间的因果关系。例如,在美国这样的种族社会里,当一个人是黑人且终生处于贫困状态,就很难判断其种族与贫困之间的先后顺序。同样,在中国二元社会结构中,一个农村贫困地区的农民终生是文盲,不识字,我们也无法判断贫困与文盲孰先孰后。但对于这两种情况,我们仍然可以判断,前一例中,种族是自变量,而贫困是因变量;后一例中,出身是自变量,而文盲是因变量。此时的判断依据不是时间上的先后顺序,而是事物之间的逻辑,通常情况下,我们是通过变量的不变性与可变性来确定其相互之间的因果逻辑关系的。因为种族和出身都是先天的因素,因而是固定的、不变的、持久存在的因素,而贫困或文盲是可以变化的。在社会调查研究中,我们常常将一些固定性、持久性的变量作为自变量,如性别、年龄、民族、出身等等。当然,这里的不变性与可变性、持久性与暂时性、固定性与变动性,都是相对的,要在具体的相互关系中进行判断。

第三,变量间关系的直接性。即变量X与变量Y的关系不是源于第三个变量影响的结果,如果变量X与变量Y之间的关系是由某个第三变量同时影响的结果,则它们之间的关系就是一种虚假关系或表面关系。例如,国外有人统计发现,城市动物园里的动物数量越多,城市的犯罪率越高,似乎二者之间有某种因果关系。但进一步研究发现,二者毫无关系,它们之间的相关性是由城市规模与城市人口密度所决定的。因为城市越大,动物园的规模通常也越大,其中的动物数量也越多;同时,城市规模越大,城市人口密度越大,城市的犯罪率也越高。而城市动物园里的动物数量与城市犯罪率之间只是一种虚假相关,更不可能有因果关系。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈