首页 百科知识 时间序列分析模型如何检验

时间序列分析模型如何检验

时间:2022-07-01 百科知识 版权反馈
【摘要】:(一)资料来源1.收入不平等的宏观测量数据已往的大量研究主要采用基尼系数,这也是度量收入不平等的最常用指标。国内关于收入不平等和基尼系数的研究文献很多,但国家官方统计数据中并未给出基尼系数,对全国总体基尼系数的定量研究也极为有限。

(一)资料来源

1.收入不平等的宏观测量数据

已往的大量研究主要采用基尼系数,这也是度量收入不平等的最常用指标。国内关于收入不平等和基尼系数的研究文献很多,但国家官方统计数据中并未给出基尼系数,对全国总体基尼系数的定量研究也极为有限。一些学者在全国总体基尼系数的计算方面进行了许多开拓性的工作,如李实等根据两次全国性调查计算了1988年和1995年全国总体基尼系数[65],李强等根据全国范围抽样调查数据计算了1994年全国总体基尼系数[66]。应该说这些测算工作对准确了解调查年份的全国收入不平等状况具有重要意义,但不能提供关于长期连续的时间序列数据。如何利用国家统计局已有的城乡收入统计资料(这些资料是长期连续的),在对传统的基尼系数计算方法进行改进的基础上测算连续的全国基尼系数时间序列,就成为许多学者思考和尝试的领域。早期如陈宗胜等应用“分层加权”计算方法估计的1988~1998年全国总体基尼系数[67],以及近年程永宏(2007)获得的1978~2005年的全国总体基尼系数和陈建东等(2008)获得的1978~2005年的全国总体基尼系数。其中,程永宏的测算结果中缺少1978、1979、1980、1991和2005年的全国总体基尼系数,而陈建东所得结果则是完整的1978~2006年全国总体基尼系数时间序列[68-70]。因此笔者主要考虑应用陈建东等关于全国总体基尼系数时间序列数据。

2.人群健康的宏观测量数据

婴儿死亡率、孕产妇死亡率和期望寿命是人群健康综合测量的常用指标,而且要进行收入不平等与人群健康的生态研究,必然要求获得与基尼系数相对应的人群健康综合测量指标的连续时间序列数据,但是,关于上述3个人群健康测量指标的全国层面数据状况也存在一些问题。虽然1981、1990和2000年全国人口普查给出了相应普查年份的婴儿死亡率和期望寿命数据,却不是连续的时间序列数据。国内关于婴儿死亡率和孕产妇死亡率的系统监测始于20世纪90年代,《2009年中国卫生统计年鉴》给出了全国1991~2008年连续的婴儿死亡率和孕产妇死亡率时间序列数据。其中1996年的婴儿死亡率和孕产妇死亡率数据直到《2008年中国卫生统计年鉴》才给出。事实上,本着经济高效和集中管理的原则,原卫生部妇幼司决定将全国出生缺陷监测、孕产妇死亡监测和5岁以下儿童死亡监测三网监测点合并,并于1996年1月正式实施,即所谓的“三网合一”,形成了统一的全国妇幼卫生监测网络。1991~1995年儿童死亡监测覆盖了全国81个市、县部分地区,约855万人;1996年实施“三网合一”方案,监测点扩为116个市、县的部分地区,覆盖1 200余万人[71]。全国孕产妇死亡率的监测数据从1989年就开始,早于婴儿死亡率的监测。在本研究中采用的孕产妇死亡率为《2009年中国卫生统计年鉴》给出的1991~2008年的时间序列数据以及《2001年中国卫生统计提要》中给出的1990年孕产妇死亡率数据,采用的婴儿死亡率为《2009年中国卫生统计年鉴》中给出的1991~2008年的时间序列数据。关于1990年的婴儿死亡率,1990年全国第四次人口普查获得全国婴儿死亡率(32.9‰)明显低于1991年(50.2‰)和1992年(46.7‰)的监测数据[72,73]。故为增强时间序列的一致性,本研究不采用1990年全国第四次人口普查的婴儿死亡率。

与全国婴儿死亡率和孕产妇死亡率的连续时间序列数据相比,国家官方统计部门给出的全国出生时期望寿命(以下简称期望寿命)的数据分散,主要依赖于人口普查和人口抽样调查。仅联合国开发计划署(United Nations Development Programme,UNDP)的《人类发展报告》(Human Development Report)给出了较连续的中国期望寿命时间序列数据,其最早发布的1990年《人类发展报告》中给出了1987年中国期望寿命。1991和1992年《人类发展报告》给出的均为1990年中国期望寿命(70.1岁),高于1990年全国第四次人口普查获得的全国期望寿命数据(68.6岁),也明显高于1995~1999年《人类发展报告》连续给出的中国1992~1995年的期望寿命数据,而《人类发展报告》给出的1992年中国期望寿命数据(68.5岁)非常接近于1990年中国人口普查获得全国期望寿命数据。但UNDP《人类发展报告》并没有给出1996、2006和2008年的中国期望寿命数据(最新的2009年10月发布的2009年《人类发展报告》中给出的是2007年中国期望寿命数据),故本研究中采用1990年中国人口普查获得期望寿命和UNDP《人类发展报告》中其他年份的中国期望寿命数据[74]共同构成全国期望寿命的基础时间序列数据。

3.收入绝对水平

由于大量研究表明收入绝对水平将对人群健康具有重要影响,故在探讨关于收入不平等与人群健康指标的生态关联时,将纳入人均国内生产总值(GDP)代表收入绝对水平的宏观指标,相应数据来源于《中国统计年鉴》。

(二)方法

1.时间序列缺失数据的填补

综合上述关于全国婴儿死亡率、孕产妇死亡率和期望寿命连续时间序列数据资料可得性的探讨,以及保证一定数量的年度资料,使时间序列相关分析能得以有效进行,本部分研究将以1990~2008年为时间框架收集这3个人群健康指标的全国数据,对时间序列中的缺失数据进行填补,包括插值(interpolation)和预测(prediction)。其中,预测主要应用ARIMA模型;由于注意到3个人群健康指标时间序列的曲线特点,插值主要应用3次样条插值(cubic spline interpolation)的方法。

样条插值是插值的一种类型,即所插入的值是一种特殊的分段多项式(称为样条,spline)。样条插值优于多项式插值,因为样条插值可以使用低阶多项式样条实现较小的插值误差,这样就避免了使用高阶多项式所出现的Runge现象[75]。假设有n+1个不同的节点xi,x0<x1<…<xn-1<xn以及n+1个节点值yi,对于n+1个给定点的数据集{xi},我们可以用n段三次多项式在数据点之间构建一个3次样条。如果

表示对函数f进行插值的样条函数。实际上3次样条是在Sobolev空间H2([a;b])最小化函数,即的函数。函数J包含对于函数f(x)全部曲率的近似,样条是f(x)最小曲率的近似。

差分自回归滑动平均模型(滑动也译作移动),又称求合自回归滑动平均模型(autoregressive integrated moving average,ARIMA),是由博克思(Box)和詹金斯(Jenkins)于20世纪70年代初提出的一个时间序列预测方法,所以又称为Box-Jenkins模型。ARIMA(p,d,q)中,AR是“自回归”,p为自回归项数;MA为“滑动平均”,q为滑动平均项数;d为使之成为平稳序列所做的差分次数(阶数)。ARIMA(p,d,q)模型是ARMA(p,q)模型的扩展。ARIMA(p,d,q)模型可以表示为:

其中,L是滞后算子(Lag operator),L(Xt)=Xt-1,εt是均值为零的随机噪声,φi,θi为系数(是常量),p,q,d都是大于零的整数。ARIMA模型的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列,并进行预测[76]

2.时间序列特征分析和模型研究

通过插值和预测形成完整的1990~2008年各指标值的时间序列,然后进一步研究收入不平等时间序列与人群健康指标时间序列的关联。在分析过程中将用到一系列与时间序列有关的方法。首先是考察时间序列的自相关性(autoregression)和时间序列的平稳性,分别采用D-W检验、单位根检验(unit root test)。在完成上述关于各时间序列的特征之后,进一步通过协整(cointegration)检验考察时间序列变量之间的长期均衡关系,以帮助确定回归方程中的变量选择。然后,对存在协整的时间序列变量进行Granger因果关系检验,以判断变量之间因果关系的方向。

(1)D-W检验:本研究需要考察两个时间序列的关联,传统的回归方法没有考虑时间序列自身的自相关问题,即模型中随机误差项的各期值之间存在着较强的相关关系。自相关违反了OLS回归的基本要求之一,即残差之间的独立性。如果残差之间有自相关,虽然不会影响回归系数的值,但会影响(低估)回归系数的标准误差(即自变量回归系数出现显著统计学意义,从而犯Ⅰ类错误)。解决这个问题的一个方法是采用D-W检验,通过计算DW统计量来检验回归方程中一阶自相关的存在性,即

DW存在临界值(下限dL和上限dU),且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。首先对用OLS方法进行线性回归拟合,得到残差et(t=1,2,…,n)。如果不存在自相关问题,DW值应趋近于2。若DW值为零,表明存在完全的正自相关;若DW值为4,则表明存在完全负自相关。如果dU≤DW≤4-dU,说明原序列不存在自相关;如果DW≤dL或DW≥4-dL,说明原序列存在自相关;如果dL<DW<dU或4-dU<DW<4-dL,表示落入盲区,无法判断是否存在自相关。

(2)单位根检验:对不同时间序列进行关联(或因果关系)的确定除了自相关问题之外,还需要考察时间序列的平稳性(stationarity)。单位根检验是检验时间序列是否平稳的重要方法。单位根检验是统计检验中普遍应用的一种检验方法。对单位根过程进行假设检验主要包括两种方法:ADF(Augmented Dickey-Fuller)方法[77]和PP(Phillips-Perron)检验法[78]。本研究中将采用ADF方法进行单位根检验。ADF检验对应的模型如下:

其中,α是常数,β是时间序列的趋势系数,p是自回归过程的滞后阶数。如果α= 0而且β=0,则属于随机游走;如果β=0,则属于有漂移的随机游走。ADF检验的零假设为γ=0,备择假设为γ<0。相应的统计量如下:

ADF统计量是一个负值,负值的绝对值越大,表示越加拒绝存在单位根的假设,即所检验的时间序列是平稳的。

(3)协整检验和误差修正模型:经典回归模型是建立在稳定时间序列数据变量基础上的。对于非稳定变量,不能使用经典回归模型,否则会出现虚假回归(spurious regression)等诸多问题,这就给经典回归分析方法的应用带来很大限制。但是,如果变量之间存在长期的稳定关系,即它们之间是协整的(cointegration),则仍可使用经典回归模型方法。为检验两变量Yt,Xt是否协整,Engle和Granger于1987年提出两步检验法,也称EG检验[79]

首先用OLS方法估计方程Yt01 Xtt,并计算非均衡误差,得到

称为协整回归。其次对的单整性检验,方法仍用ADF检验。因协整回归中已含截距项,故此时检验模型中无需再纳入截距项。模型如下:

如果拒绝零假设H0:δ=0,则提示误差项et是平稳时间序列,说明X与Y协整。需注意这里ADF检验是针对协整回归计算出的误差项而非真正的非均衡误差μt进行的。而OLS法采用了残差最小平方和原理,因此估计量δ是向下偏倚的,这样将导致拒绝零假设的机会比实际情形大。于是对et平稳性检验的ADF临界值应该比正常的ADF临界值要小,实际应用时参考MacKinnon(1991)给出的协整检验临界值[80]

在Engle和Granger(1987)提出协整检验法后,Johansen(1988,1991)及Johansen和Juselius(1990,1992)提出一种用极大似然法(maximum likelihood)进行协整检验的方法,通常称为JJ检验。此外,在实践中还应用两种方法,包括Wickens和Breusch(1988)提出的一步法(one-stage approach)以及Pesaran和Shin (1995)提出的自回归分布滞后模型方法(autoregressive distributed lag model approach)[81-84]。各类协整模型方法不同,存在各自的优缺点。

本研究将采用Johansen(1988,1991)及Johansen和Juselius(1990,1992)提出的方法进行协整检验。

若非平稳的变量之间存在协整关系,则可进一步建立向量误差修正模型(vector error corrected model),即VEC模型。Johansen发展了以VAR(vector autoregression,VAR)为基础的非平稳多变量时间序列的协整检验,并在此基础上建立了包含协整约束条件的VAR模型,即向量误差修正模型,为带有误差修正项的VAR模型。对应具有协整关系的变量Y与X,VEC模型的公式如下:

其中EC为误差修正项,Δ代表一阶差分。误差修正模型比普通的VAR模型更全面地反映了变量间的短期和长期的关系。在误差修正模型中,被解释变量的波动可以分为两部分:一部分是短期波动,各个差分项反映变量短期波动的影响:另一部分是长期均衡,反映于ECM中。ECM常表现为反向修正机制,即其系数λ为负。此外,由于VEC模型针对的是ΔYt(Yt的一阶差分),故VEC模型的滞后阶数要比VEC模型小1。当然也可通过对VEC模型的AIC和SBC值的方法判断最适宜的滞后阶数。

可以在协整检验之后对存在协整关系的变量进行VEC模型分析,因为协整检验的潜在依据是VAR模型,但此时对变量之间因果关系尚未明确。也可在进行Granger因果关系检验后获得协整变量之间的因果先后顺序后进行VEC模型分析。VEC模型分析(事实上也可基于VAR模型)还可基于更长滞后期的框架考察对某个特定变量的扰动冲击给其他变量带来的影响,包括判断影响的持续性以及其大小和方向,进行该分析的方法是构建脉冲响应函数(impulse response function)。

(4)Granger因果关系检验:在用ADF检验对时间序列的平稳性进行判断后,进一步可对几个平稳时间序列的因果关系进行判断,常用的方法为Granger因果关系检验。Granger(1969)将因果关系定义为:如果使用变量Y的过去值比不使用它能更好地预测X(在两种情形下都使用了X的过去值),则称Y引起(cause) X。如果Y引起X而X不引起Y,则Y与X之间的因果关系是单向的(Y引起X);如果Y与X之间不存在相互“引起”的关系,则两者在统计上是独立的(statistically independent),如果两者存在相互“引起”的关系,则因果关系是双向的[85]。虽然已有研究表明,随着时间序列样本含量越小,Granger因果关系检验能力越弱。但就小样本而言,Granger检验优于Sims(1972)检验[86-88]。Granger检验包括两个回归方程和两个假设,即

其中,n=X与Y之间的有效滞后;如果拒绝Bs=0,则提示Y引起X;如果拒绝Cs=0,则提示X引起Y(滞后值),同时拒绝两个零假设,则X与Y互为因果(feedback effect)。

对时间序列变量之间的因果关系判断,无论时间序列是否为平稳序列,均有必要先考察两者之间的协整关系。本研究应用Engle和Granger(1987)提出的因果关系检验。Engle和Granger(1987)及Granger(1988)指出,如果两个时间序列变量协整[89],那么两者之间至少存在一个单向的Granger因果关系。那么,另一个需要解决的重要问题就是这两个变量之间因果关系的方向。具体方法是通过协整检验的两个时间序列变量采用向量自回归(vector autoregression,VAR)模型(因两个时间序列变量是协整的,故可用变量原值),然后进行Granger因果关系检验。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈