首页 百科知识 模型的共线性消除

模型的共线性消除

时间:2022-03-28 百科知识 版权反馈
【摘要】:1. 检验各解释变量是否存在多重共线性劳动力市场的城乡分割、行业分割、地区分割和单位性质分割程度变量之间是否存在多重共线性问题呢?表5-9 检验R2的显著性表5-9的检验结果表明,变量x1,x2,x3,x4之间都存在共线性。实际上,普通最小二乘估计量的方差和标准差较大,置信区间变宽,t值不显著,回归系数的符号有时有误,这些局限性说明模型中的多重共线性问题值得重视。
模型的共线性消除_劳动力市场分割与农民工就业实证研究

1. 检验各解释变量是否存在多重共线性

劳动力市场的城乡分割、行业分割、地区分割和单位性质分割程度变量之间是否存在多重共线性问题呢? 为了发现是否存在多重共线性回归问题,以下用相关系数法和辅助回归方法来验证。

首先,计算解释变量x1,x2,x3,x4两两之间的相关系数,用SPSS软件得到如下结果:

表5-8 劳动力市场分割程度各变量两两相关系数表

** Correlation is significant at the 0.01 level(2-tailed)。

从上面结果可以看出,解释变量x1与x2之间的相关系数为0.934,解释变量x1与x4之间的相关系数为0.827,解释变量x2与x3之间的相关系数为0.809,解释变量x2与x4之间的相关系数为0.910,解释变量x3与x4之间的相关系数为0.912,都超过0.8,则可能存在较为严重的多重共线性(古亚拉提,2000)。

其次,作每个变量对其余变量的回归并计算相应的R2值,采取辅助回归方法。

作x1对x2,x3,x4,x2对x1,x3,x4,x3对x1,x2,x4,x4对x1,x2,x3的回归,求样本决定系数R2,分别记为R21,R22,R23,R24。根据公式:

其中n=21,k=5,结果如表5-9所示。

表5-9 检验R2的显著性

表5-9的检验结果表明,变量x1,x2,x3,x4之间都存在共线性。

2. 删除一些解释变量减少共线性

考虑有多重共线性问题,现在尝试删除1个、2个或3个解释变量的情形,得到模型结果如表5-10所示。

对以上11个回归方程,着重考虑比较以下指标: 第一,t值不显著的个数与解释变量个数的比值,这个比值越低模型越优;第二,R2值越大,模型越优; 第三,F值越大,模型越优。综合上述指标,选择y对x1,x2,x4的回归为相对较优模型。y对x1,x2, x4的回归结果总结如下:

表5-10 农民工就业与劳动力市场不同分割程度变量11个回归方程

p值=(0.000) (0.000) (0.028) (0.395)

R2=0.977

F值为237.019,分子自由度d.f.为3,分母自由度d.f.为17

Durbin-Watson的d值为0.492

3. 多重共线性后果讨论

删除地区分割程度解释变量后,多重共线性问题明显减弱,在一定程度上对模型进行了优化,得到了模型(5-12),但是模型(5-12)中依然存在轻微多重共线性现象。

理论上,即使存在多重共线性的情况下,普通最小二乘估计量仍是最优线性无偏估计量(BLUE),即在所有线性无偏估计量中,普通最小二乘估计量具有最小方差性。实际上,普通最小二乘估计量的方差和标准差较大,置信区间变宽,t值不显著,回归系数的符号有时有误(如x4的系数β4=10.962>0,就是“错误”的,因为按理说劳动力市场单位性质分割与农民工就业是反方向变动),这些局限性说明模型中的多重共线性问题值得重视。

但模型(5-12)中的多重共线性现象并不影响研究结论,正如Johnston(1984)指出,尽管存在多重共线性,但在常用的显著性水平(如α=5%)下,估计的R2和大多数单个回归系数是统计显著的,如果研究是为了用模型来预测被解释变量的均值,多重共线性的影响可以忽略不计。至于模型中回归系数有误,在下面的章节中通过其他办法对模型进行更进一步的优化。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈