首页 理论教育 用进行线性回归分析

用进行线性回归分析

时间:2022-04-22 理论教育 版权反馈
【摘要】:六、用SPSS进行线性回归分析线性回归分析是考察多个自变量对因变量的回归模型,最简单的是一元线性回归分析。建立回归方程时,根据设定的条件剔除部分自变量。表示当回归方程中引入或剔除一个自变量后R2的变化量,如果R2ch较大,那么说明进入和剔除回归方程的自变量有可能是一个较好的回归变量。输出各变量的误差容限以及共线性诊断表。

六、用SPSS进行线性回归分析

线性回归分析是考察多个自变量对因变量的回归模型,最简单的是一元线性回归分析。但实际应用中,极少有一个因变量只受一个自变量影响的情况,所以下面的分析过程是按照多个自变量的回归过程列出的。当只有一个自变量时,分析过程完全一样,且更简单。

线性回归分析的操作步骤如下:

第一步,按Analyze—Regression—Linear顺序,打开Linear Regresstion对话框。

第二步,在左侧的源变量框中选择一个变量进入Dependent框中作为因变量,选择一个或多个变量进入Independent(s)框中作为自变量。

如果选择不同的自变量、因变量组或不同的方法来建立回归方程,可以将每次所选择的自变量和因变量保存在第n个模块中,在以后的回归分析中若要重复某一次回归分析过程或改变方法,则可以利用Previous与Next按钮来确定各模块中的自变量和因变量。

自变量与因变量必须是数值型变量,对名义变量(定类变量)必须重新编码,转换为数值型的才能参与回归分析。

第三步,在Method框中选择一种回归分析方法。

Enter,强行进入法。即所选择的自变量全部进入回归模型。

Remove,消去法。建立回归方程时,根据设定的条件剔除部分自变量。

Forward,向前选择法。根据在Option对话框中所设定的判据,从无自变量开始。在拟合过程中,对被选择的自变量进行方差分析,每次加入一个F值最大的变量,直至所有符合判据的变量都进入模型为止。第一个引入回归模型的变量应该与因变量间相关系数绝对值最大。

Backward,向后剔除法。根据在Option对话框中所设定的判据,先建立全模型,然后根据设置的判据,每次剔除一个使方差分析中的F值最小的自变量,直到回归方程中不再含有不符合判据的自变量为止。

Stepwise,逐步进入法。它是向前选择变量法与向后剔除变量方法的结合。

第四步,根据变量值选择参与回归分析的观测量,将作为参照的变量进入Selection Variable框中,单击Rule按钮,打开Set Rule对话框,在Set Rule对话框中确定运算法则与数值。

第五步,在Case Label下面输入变量名,用其值作为观测量标签。

第六步,单击WLS按钮,选择一个作权重的变量进入WLS Weight框中。

第七步,单击Statistics按钮,打开Statistics对话框,可以选择输出的统计量。

1.Regression Coefficients栏,有关回归系数的选择项

(1)Estimates复选项,输出回归系数B、B的标准误差、标准回归系数beta、B的T值以及T值的双侧检验的显著性水平Sig。

(2)Confidence intervals选项,输出每一个非标准化回归系数95%的置信区间

(3)Covariance matrix复选项,输出非标准化回归系数的协方差矩阵、各变量的相关系数矩阵。

2.与模型拟合及其拟合效果有关的选择项

(1)Model fit复选项。

输出引入模型与从模型中剔除的变量,提供复相关系数R,复相关系数平方R2,及R2的修正值、估计值的标准误差,ANOVA方差分析表。

(2)R squared change复选项。

表示当回归方程中引入或剔除一个自变量后R2的变化量,如果R2ch较大,那么说明进入和剔除回归方程的自变量有可能是一个较好的回归变量。选择此项输出R2ch、Fch、Sigch。

(3)Descriptives复选项。

输出合法观测量的数目、变量的平均值、标准差、相关系数矩阵和单侧检验显著性水平矩阵。

(4)Part and partial correlation复选项。

输出部分相关系数(表明当一个自变量进入回归方程后,R2增加了多少)、偏相关系数(表示排除了其他自变量对Y的影响后,与因变量Y的相关程度)与零阶相关系数(变量之间的简单相关系数)。

(5)Collonearity diagnostics选项。

输出各变量的误差容限以及共线性诊断表。

3.Residuals栏,有关残差分析的选择项

(1)Durbin-watson,输出Durbin-watson统计量以及可能是奇异值的诊断表。

(2)Casewise diagnostics,输出测量诊断表。

(3)Outliers outside standard deviation,设置奇异值的判据。默认为>3倍标准差。

(4)All cases选项,输出所有观测量的残差值。

第八步,需要绘制图形时,单击Plots按钮,打开Plots对话框。在对话框中选择制作图形,默认情况下,不输出图形。

1.选择轴变量

在左上角的源变量框中,选择Dependent(因变量)进入X(或Y)轴变量框;选择其他变量进入Y(或X)轴变量框。可以作为轴变量的,还有以下参数:

(1)Dependent选项,因变量。

(2)ZPERD选项,标准化预测值。

(3)ZRESID选项,标准化残差。

(4)DRESID选项,剔除残差(DELETED RESIDUALS)。

(5)ADJPERD选项,修正后预测值。

(6)SRESID选项,学生化残差。

(7)SDRESID选项,学生化剔除残差。

2.Standardized Residual Plots栏中选择直方图和正态概率图

(1)Histogram,输出带有正态曲线的标准化残差的直方图。

(2)Normal Probability plot,残差正态概率图,检查残差正态性。

3.Produce all partial plots复选项

输出(针对每一个自变量)产生一个自变量残差相对于因变量残差的散布图。

第九步,单击Save按钮,打开Save对话框,将分析结果作为新变量保存到数据窗。

1.Predicted Values预测值栏

(1)Unstandardized复选项,保存非标准化预测值。

(2)Standardized复选项,保存标准化预测值。

(3)Adjusted复选项,保存调节预测值。

2.Distances距离栏

3.Prediction intervals预测区间栏

(1)Mean复选项,保存预测区间上下限的平均值。

(2)Individual复选项,保存一个观测量上限与下限的预测间距。

选择上述两个复选项后,在Confidence interval参数框中确定置信度,默认值为95%。所键入的值必须在0~100之间。

第十步,用鼠标单击OK按钮提交系统运行。

【注释】

[1]注意:此调查结果来自一个配额抽样样本,被访者都是年龄在18~42岁的北京城区白领观众。

[2]注意:此调查结果来自一个配额抽样样本,被访者都是年龄在18~42岁的北京城区白领观众。

[3]应用SPSS分析时,会出现一些本书未讲到的统计量,文中只给出这些统计量的说明,并不讲解其具体意义,请初学者略过或查阅相关统计参考书。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈