首页 理论教育 支持向量回归的方法和方法

支持向量回归的方法和方法

时间:2022-11-27 理论教育 版权反馈
【摘要】:以下为神经网络进行拟合和预测时,得到的权重和阈值。从表6-6、6-7、6-8中我们可以看到,3张表中的线性回归2方法的均方根误差和平均绝对误差都要小于线性回归1的均方根误差和平均绝对误差,从该数据我们可以看到加入上证最低价格、上证收盘价格和深证最低价格这3项指标的滞后5期作为自变量可以使预测效果更好,这也验证了上一节中,上证最低价格、上证收盘价格和深证最低价格这3项指标确实和核心通货膨胀存在着格兰杰因果关系。

支持向量回归实现是通过matlab来完成的,支持向量回归实现的工具箱是libsvm(a library for support vector machines),该工具箱是由台湾大学林智仁教授研发的支持向量机,它简便易用,可以解决多种情况下的分类和回归问题。对于参数的选择,本书选用了网格法、遗传算法和粒子群法,如图6-1、6-2、6-3所示是以拟合为例,这3种寻参方法的过程,需要选择的参数包括惩罚因子C和RBF核函数参数γ。

图6-1 网格法搜索最优参数

图6-2 粒子群法搜索最优参数

图6-3 遗传算法搜索最优参数

通过使用网格法、遗传算法和粒子群法寻参,我们得到了一次拟合、一次半年预测和一次一年预测核心CPI的最优参数,其中,表6-5是网格法、遗传算法和粒子群法这3种方法3次寻参得到的最优参数C和γ。

表6-5 网格法、PSO法和GA法搜索到的最优参数

使用BP神经网络进行预测时,本书选择的隐藏层节点数为5,测试误差精度为0.00004,BP神经网络预测最需要确认的变量为各隐藏层和输出层的权重阈值。以下为神经网络进行拟合和预测时,得到的权重和阈值。

神经网络拟合2001年1月—2013年12月核心CPI时的权重和阈值:

根据式6-4,6-5本书分别对加入未加入股票价格自变量滞后5期作为自变量(线性回归1)和加入股票价格滞后5期作为自变量(线性回归2)的序列进行了线性回归,SVR的回归使用了3种方法寻参得到惩罚因子C和RBF核参数γ,将3组参数代入SVR预测命令中,我们得到了不同的预测结果。为了使预测结果的比较不会因为样本选择的不同而发生变化,本书进行了3次预测,包括一次拟合、一次半年期预测和一次一年期预测,预测结果使用均方根误差(RMSE)和平均绝对误差(MAE)来评价,拟合效果比较如表6-6、6-7、6-8所示。

表6-6 3种方法拟合效果比较

表6-7 3种方法预测6期效果比较

表6-8 3种方法预测12期效果比较

从表6-6、6-7、6-8中我们可以看到,3张表中的线性回归2方法的均方根误差和平均绝对误差都要小于线性回归1的均方根误差和平均绝对误差,从该数据我们可以看到加入上证最低价格、上证收盘价格和深证最低价格这3项指标的滞后5期作为自变量可以使预测效果更好,这也验证了上一节中,上证最低价格、上证收盘价格和深证最低价格这3项指标确实和核心通货膨胀存在着格兰杰因果关系。另外,BP神经网络预测的均方根误差和平均绝对误差都要小于线性回归1和线性回归2的均方根误差和平均绝对误差,从这个数据来看,BP神经网络的非线性回归要优于基于最小二乘方法的线性回归,但是BP神经网络由于权重、阈值和节点数的不同,预测的结果不稳定,该方法还有改进的余地。最后支持向量回归方法在3次预测过程中均方根误差和平均绝对误差都要小于线性回归和神经网络,并且,支持向量回归比BP神经网络优越的一点就是,支持向量回归在全局只有唯一最佳解,得到的结果唯一稳定,从以上3次的预测结果来看,支持向量回归的方法预测能力要比神经网络和线性回归优秀。另外,对于支持向量回归的寻参方法来说,在第一次拟合过程中,网格法得到的拟合误差最小,在第二次预测半年期核心通货膨胀的过程中,遗传算法要比网格法和粒子群法预测误差稍微小一些,在第3次预测12期的核心通货膨胀时,遗传算法也是要比网格法和粒子群法预测性能稍好一些,虽然这3种方法整体上拟合的误差相差不大,几乎没有太大差别,但是,遗传算法的简便快速大大缩短了寻参的时间,我们最终将采用遗传算法来进行支持向量回归的最佳参数寻找。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈