首页 百科知识 构建犃犚犐犕犃模型

构建犃犚犐犕犃模型

时间:2022-07-11 百科知识 版权反馈
【摘要】:以上是对我国城乡收入差距演变轨迹的整体判断,为了把握未来五年我国城乡收入差距的变化趋势,本节尝试依据我国1978—2013年城镇家庭人均可支配收入和农村居民家庭人均纯收入数据建立差分自回归移动平均模型,对未来5年的城乡收入差距的变动趋势进行预测。因此,我们可以从对原始数据的分析得到初步判断:我国城乡相对收入差距总体呈现震荡上升趋势,明显属于非平稳性时间序列。

以上是对我国城乡收入差距演变轨迹的整体判断,为了把握未来五年我国城乡收入差距的变化趋势,本节尝试依据我国1978—2013年城镇家庭人均可支配收入和农村居民家庭人均纯收入数据建立差分自回归移动平均模型(ARIMA模型),对未来5年的城乡收入差距的变动趋势进行预测。

(一)数据来源和处理

本节数据来源为历年中国统计年鉴,共搜集了1978—2013年我国城镇居民家庭人均可支配收入和农村居民家庭人均纯收入的近35年的数据。

从绝对收入差距来看(见表3.8),1978年城乡绝对收入差距仅为209.8元,而2013年城乡绝对收入差距竟然高达18059.2元,增长近85倍。显而易见,如果运用城乡绝对收入差距数据进行趋势预测是偏离真实现状的,因为在改革开放近35年中,城乡居民的收入增加是客观存在的,再加上通货膨胀等货币因素对实际收入的影响,必然导致城乡收入差距的绝对值增高。

为了消除通货膨胀等物价因素对实际收入的影响,本节对城镇居民家庭人均可支配收入指标(UI)和农村居民家庭人均纯收入指标(RI)进行物价消费指数CPI平减处理后,计算城乡相对收入差距指标(见表3.9)对未来5年内的城乡收入差距的变动趋势进行预测,即:

表3.8 1978—2013年城乡绝对收入差距(元)

数据来源:历年中国统计年鉴数据整理所得。

表3.9 1978—2013年城乡相对收入差距指标

数据来源:历年中国统计年鉴数据整理所得。

(二)时间序列平稳性检验

由于时间序列模型的平稳性特点,在对数据进行模型拟合前,必须进行平稳性检验。若时间序列不平稳,则需要通过差分方法将不平稳序列转变为平稳序列。

利用1978—2013年城乡相对收入差距的时序图进行平稳性检验(见图3.9),可以观察到1990年以后城乡相对收入差距总体上呈现震荡上升趋势,显然不具有平稳性。除了观察时序图外,还可以对序列自相关图(见图3.10)进行进一步检验,以判断序列的平稳性,二阶标准差随着延时步数的增加有着显著的递增趋势,表明原序列有上升趋势。

因此,我们可以从对原始数据的分析得到初步判断:我国城乡相对收入差距总体呈现震荡上升趋势,明显属于非平稳性时间序列。针对原始时间序列需要重点剔除两个影响因素,以弱化其不平稳性:一是剔除影响该序列的线性递增趋势因素;二是剔除可能存在的时间周期季节性因素。

对非平稳的原始时间序列进行一阶差分运算,使其递增趋势因素得以剔除,差分结果通过一阶差分时序图来展示(见图3.11)。一阶差分后的时序图中的数据走势总体上已趋于水平,表明原序列已被剔除递增趋势而趋向平稳。

图3.9 城乡相对收入差距时间序列

图3.10 相对收入差距时序自相关

图3.11 一阶差分时序

图3.12 一阶差分序列自相关

在时间序列平稳后,才可以建立时间序列模型,而在建模前,还需进一步检验一阶差分后的平稳时间序列是否存在季节周期性因素,该季节性检验可以通过观察一阶差分序列自相关图(见图3.12)实现。一阶差分序列自相关图能反映总体回归模型随机误差项之间存在的相关关系,不难发现经过一阶差分后,新的序列存在周期性波动,在延迟四步时略大于二阶标准差,可见其波动主要以4年为周期,由此可以再进行四步同周期差分(见图3.13),提取其中的周期波动因素。

经过一阶四步周期差分后,原时间序列的递增趋势和季节周期波动因素已被剔除,进而进行白噪声检验来判断一阶四步差分后序列是否为平稳的非白噪声序列(见图3.12)。在白噪声检验中,C值(Chi Square)的P值(Pr>Chi Sq)在延迟阶段(To Lag)小于0.05的概率值,表示估计的参数在5%的水平上显著。因此,可以判断原序列在经过一阶四步差分后已转变为平稳的时间序列,基本符合构建ARIMA模型的拟合要求。

图3.13 一阶四步差分时序

(三)ARIMA模型的构建

原始时间序列经过差分后已经转变为平稳的时间序列,但是图3.13和图3.14,仍反映出季节周期效应(上下震荡)和短期相关效应,其周期性和短期相关性具有十分复杂的关联性,而无法通过简单加成来提取其季节周期性和短期相关性。因此,尝试以乘积的形式试拟合ARIMA(p1,d1,q1)*(p2,d2,q2)s模型,其中,p1、p2为自回归部分阶数,q1、q2为滑动平均部分阶数,d1、d2为差分阶数。模型以简单的ARIMA(p1, d1,q1)来提取序列的短期相关性,再以ARIMA(p2,d2,q2)s并以周期步长为单位来提取其季节周期性,尝试使两者以乘积的方式结合来同时反映序列的相关性和周期性。

图3.14 一阶四步差分白噪声检验

因此,最终选定的拟合模型结构为:ARIMA(p1,d1,q1)*(p2, d2,q2)s,即:其中,!!s表示以周期s为步长的季节差分运算;xt表示第t期的时间序列值;θq1、θq2s、φp1、φp2s表示估计参数;p1、p2表示自回归阶数;q1、q2表示滑动平均阶数;B表示算子;εt表示第t期的残差;μ表示截距。

结合时间序列的周期性特征,可以将周期步长取值为4,即ARIMA (p2,d2,q2)s中的s取值为4,不考虑其短期相关性,p2、q2直接取值为1,同时,模型已经过一阶差分,差分的阶数d1、d2可直接取值为1。经过反复的尝试和测算,模型最终定阶为:ARIMA((1,2),1,3)*(1,1, 1)4,即:

利用SAS软件中的Estimate语句可以轻松地计算出模型的参数。另外,SAS软件自带三种参数估计方法,分别为:最小二乘估计方法、条件最小二乘估计方法和极大似然估计方法,SAS软件默认的是条件最小二乘估计方法。由于利用各种方法估计的参数略有不同,经过反复验证,调用最为常见的最小二乘估计方法。具体参数结果如下所示:

ARIMA((1,2),1,3)(1,1,1)4模型结果为:

为直观显示模型的拟合效果(见图3.15),将城乡相对收入差距原始序列值、预测序列值做图,可以发现除少数极端数值外,绝大部分原始序列值基本处于拟合状态,可以证明模型ARIMA((1,2),1,3)*(1,1, 1)4是可信的。

图3.15 城乡相对收入差距拟合

注:*代表了原序列值,红色曲线代表预测值。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈