首页 百科知识 预测方法及其结果

预测方法及其结果

时间:2022-07-21 百科知识 版权反馈
【摘要】:预测方法及其结果_公共财政评论二、预测方法及其结果(一)指数平滑方法指数平滑方法可以通过调整对时间序列中包含的短期趋势的估计,自动追踪数据的变化,实现对短期变动趋势的预测。支持向量机方法预测结果的误差率在16.28%~45.44%之间波动,平均绝对百分误差为30.29,支持向量机方法的预测效果并不理想。使用这一方法预测结果不理想的原因同样可能是输入信息量过小。

二、预测方法及其结果

(一)指数平滑方法

指数平滑方法可以通过调整对时间序列中包含的短期趋势的估计,自动追踪数据的变化,实现对短期变动趋势的预测。该方法又包括:一次指数平滑、二次指数平滑、多参数无季节趋势指数平滑和多参数有季节趋势指数平滑。因为月度收入数据的季节性和强烈的时间趋势,这里选用多参数有季节趋势指数平滑法,并使用乘积模型。

由于指数平滑方法是利用税收收入数据自身来实现预测,因此不存在模型自变量的设定与筛选等问题。我们使用2000年1月—2008年12月数据建立Holter-Winter季节乘积模型,利用2009年1—4月数据验证模型的效果。计算软件是Eviews6.0。

使用Holter-Winter季节乘积模型预测结果的误差率在4%以下,并且全部呈现偏高趋势,平均绝对百分误差(MAPE)为5.66,通常MAPE值在0~5之间,说明模型预测精度极高,因此Holter-Winter季节乘积模型的预测效果比较理想

(二)ARIMA方法

我们对税收收入的自然对数取两次差分后绘制自相关图,可以看出,在滞后3期、6期、9期和12期的自相关系数分别是0.722、0.717、0.647和0.676,显著不为0。说明税收收入数据具有强烈的季节趋势。对税收收入自然对数值逐期差分,并以12个月为步长进行季节差分,获得新序列称之为“季节调整后税收收入自然对数值”。

经差分调整后的税收收入数据很快落入随机区间,滞后12期的自相关系数值还是偏大,即使对经过季节差分调整后的数据再进行一次季节差分,滞后12期的自相关系数值依然没有落入随机区间。偏自相关系数在滞后4期后基本落入随机区间,自相关系数在滞后2期后落入随机区间,因此自回归阶数p确定为3或者4,移动平均阶数q确定为2或者3,季节差分为1次,逐期差分为1次。模型的形态为,ARIMA(p,1,q)(1,1,1)[12]。最终根据AIC和BIC值,以及参考预测精度确定模型为ARIMA(3,1,3)(1,1,1)[12]。计算软件是Eviews6.0。

使用季节调整的ARIMA模型预测结果的误差率在0.64%~10.66%之间波动,全部呈现偏高趋势,平均绝对百分误差(MAPE)为5.71,因此季节调整的ARIMA模型的预测效果也比较理想。

(三)BP神经网络方法

BP(Back Propagation)神经网络,即基于误差反向传播算法的人工神经网络,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。

在使用BP神经网络方法之前,需要对模型的设定加以说明,这里由于仅仅是使用税收月度数据来实现预测,因此选择时间趋势项、税收收入前期值作为输入元,实际的月度税收收入为输出元。隐含层层数设定为4,终止误差设定为1×10-6。在运算中,我们发现随着隐含层层数的增加和终止误差设定值的降低,会提高预测的精度,但是增加的隐含层过多、终止误差设定过低是没有意义的,预测精度不会改变。这里我们选择加入时间趋势项、不加入时间趋势项,选择前1期、前2期和前3期税收收入分别作为输入元,来比较不同的模型预测精度,并且预留出2009年1—4月的实际税收收入数据来验证模型的精度。经过计算,模型的最终形态确定为输入元为时间趋势项和前一期税收收入,输出元为实际税收收入,因为其他形态的模型不能显著提高预测精度。计算软件是R2.9.0。

BP神经网络方法预测结果的误差率在2.24%~38.27%之间波动,平均绝对百分误差(MAPE)为23.59,BP神经网络方法的预测效果并不理想。使用这一方法预测效果不理想的原因可能是输入信息量过小,因为在吴凌云博士给我们的范例中,使用GDP和二次产业GDP来预测年度税收收入时,预测误差率一般在10%以下。

(四)支持向量机方法

支持向量机(SVM)是数据挖掘中的一个新方法,能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。建立方向合适的分隔超平面,使两个与之平行的超平面间的距离最大化。其假定为,平行超平面间的距离或差距越大,分类器的总误差越小。支持向量机与神经网络类似,都是学习型的机制,与神经网络不同的是,SVM使用的是数学方法和优化技术,而支持向量机的关键在于核函数。低维空间向量集通常难以划分,解决的方法是将它们映射到高维空间。但这个办法带来的困难就是计算复杂度的增加,而核函数正好巧妙地解决了这个问题。也就是说,只要选用适当的核函数,就可以得到高维空间的分类函数。

反复比较模型的预测精度后,支持向量机模型自变量设置为时间趋势项和前一期税收收入,因变量为月度实际税收收入,模型的cost值设置为40000,ε值设置为0.001,即使将cost值设置再增加100倍,ε值设置再降低10倍,依然不改变预测精度。计算软件是R2.9.0。

支持向量机方法预测结果的误差率在16.28%~45.44%之间波动,平均绝对百分误差(MAPE)为30.29,支持向量机方法的预测效果并不理想。使用这一方法预测结果不理想的原因同样可能是输入信息量过小。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈