首页 理论教育 一元线性相关分析

一元线性相关分析

时间:2022-02-13 理论教育 版权反馈
【摘要】:从表8-2中可以看出,随着月可支配收入的提高,居民的消费支出也有相应提高的趋势,两者之间存在明显的正相关关系。田块数大多集中在对角线位置,表明两个变量之间是正相关关系。据表8-2的资料绘制的相关图如图8-1所示:从图8-1可以看出,x值小,其对应的y值也小,x值大,y值也大,散点近似直线,故居民的月消费支出和可支配收入之间呈线性相关关系。直线相关密切程度的测定方法,是用积差法计算相关系数。

相关表和相关图是研究相关关系的直观工具。一般在详细的定量分析之前,可以先利用它们对现象之间存在的相关关系的方向、形式和密切程度作大致的判断。

相关表是将若干个变量的多组数据按照其中一个变量的大小顺序排列并编排在一张表格中所形成的统计表格。根据相关变量是否分组,相关表分为简单相关表和分组相关表。

(一)简单相关表

简单相关表是指对两个变量的数据资料都不作任何的分组,直接将各组数据按照其中一个变量排序之后的结果进行编排所形成的相关表。在资料项数比较少的情况下通常采用简单相关表。

例8-1 假设对某社区2010年10户居民家庭的月可支配收入和消费支出进行调查,得到原始资料如表8-1所示。

表8-1 居民收入和消费的原始资料

根据以上原始资料,将可支配收入按从小到大的顺序排列,可编制相关表,如表8-2所示。

表8-2 居民消费和收入

从表8-2中可以看出,随着月可支配收入的提高,居民的消费支出也有相应提高的趋势,两者之间存在明显的正相关关系。

(二)分组相关表

分组相关表是指将一个或两个变量的数据先进行分组,然后将分组结果按照其中一个变量的大小顺序编排在同一张表格中所形成的相关表。按分组情况不同又可分为两种:单变量分组相关表和双变量分组相关表。

(1)单变量分组相关表是指只对两个变量中的一个变量进行分组,并计算各组的次数,而对另一个变量不进行分组,只计算其各组平均水平所形成的相关表。如表8-3所示。

表8-3 商品销售额与流通费用率相关表

(2)双变量分组相关表是指同时对两个变量都进行分组并将分组结果按一定方式编排所形成的相关表。如果两个相关变量变动均较为复杂,则可根据分析需要,同时对两个变量进行分组。具体做法是:先分别确定自变量和因变量的组数,按组数设计表格,然后分别计算各组的次数,并将次数置于相对应的空格中。如表8-4所示。

表8-4 化肥施用量与稻谷单产量双变量分组相关表

这张双变量分组相关表,按照相关图的形式做了特别的设计,形成图表结合的模式,因此,将这两个现象之间的相关关系反映得更加清楚。田块数大多集中在对角线位置,表明两个变量之间是正相关关系。除上例外,在其他方面也可以编制类似的双变量分组相关表。如工业企业按产量和成本水平同时分组,商业企业按企业规模和流通费用水平同时分组,等等。这种双变量分组相关表,可作为探寻最佳方案、提高经济效益的一种工具。

相关图又称散点图,它是以直角坐标系的横轴代表变量x,纵轴代表变量y,将两个变量之间相对应的变量值用坐标点的形式描绘出来,用来反映两个变量之间相关关系的图形。据表8-2的资料绘制的相关图如图8-1所示:

图8-1 可支配收入与消费支出相关图

从图8-1可以看出,x值小,其对应的y值也小,x值大,y值也大,散点近似直线,故居民的月消费支出和可支配收入之间呈线性相关关系。

(一)相关系数的含义

相关系数是在直线相关条件下,说明两个变量之间相关密切程度的统计分析指标。相关系数通常用r来表示。

相关系数比相关表和相关图更能概括表现相关的形式和程度。如果某一因变量受若干个自变量的影响,我们可以分别计算因变量与每一自变量的相关系数,若干个相关系数加以比较就可以找到影响因变量的具有决定作用的因素。因而相关系数对判断变量之间相关关系的密切程度具有重要的意义。

相关系数的取值范围是在-1和+1之间,即-1≤r≤+1,r>0为正相关,r<0为负相关。

相关系数r的绝对值越接近于1,表示相关关系越强,越接近于0,表示相关关系越弱。如果|r|=1,则表明两个变量完全相关,即x和y之间属于函数关系。如果r=0,则表明两个变量不直线相关。值得注意的是,r只是表示x和y的直线相关密切程度,当r为0时,并不表示x和y之间不存在其他非直线型(曲线)的相关关系。

为在实际分析时有个判别标准,一般将相关系数数值及对应的相关关系密切程度分成四个等级,如表8-5所示。

表8-5 相关系数等级

(二)相关系数的计算

直线相关密切程度的测定方法,是用积差法计算相关系数。这里,我们略去公式的推导和证明,只简要介绍公式的应用。相关系数的定义公式如下:

式中,x,y——两个变量;

237-2——两个变量的协方差;

σx,σy——两个变量各自的标准差;

237-3——两个变量各自的算术平均数。

例8-2 根据表8-2所示的居民家庭的月可支配收入和消费支出的调查资料,计算相关系数,令y为消费支出,x为可支配收入,则如表8-6所示。

表8-6 定义公式的相关系数计算表

由上例可见,利用定义公式计算相关系数较烦琐,现对定义公式做适当变换,得到以下公式:

用此公式计算相关系数不必计算两个变量数列的平均值与离差,计算简捷(称简捷法),并可减少差错。(注意计算时可利用多功能计算器的统计功能模块计算。)简捷公式的相关系数计算见表8-7。

表8-7 简捷公式的相关系数计算

计算结果说明居民月消费支出与可支配收入存在高度正相关关系。所以x和y线性关系显著,可进入回归分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈