首页 百科知识 随机采样数据

随机采样数据

时间:2024-10-11 百科知识 版权反馈
【摘要】:本节中将根据随机采样的模拟数据对四种PSO算法进行分析。利用渐近回归模型和参数组合α=70.0,β=25.0,γ=0.6在采样区间内随机采样20个样本点生成模拟数据。另外在[5,15]区间内采样时,此区间部分范围内的曲线已经趋于平缓,后两个参数β,γ已对模型的取值影响不大,也就是样本点无法反映曲线的形态。,100}样本点生成模拟数据。

6.3.2 随机采样数据

本节中将根据随机采样的模拟数据对四种PSO算法进行分析。具体内容为算法对待估计参数维数的敏感程度、采样区间对算法性能的影响、算法对数据噪声的敏感程度,即噪声对四种PSO算法的收敛性和稳定性的影响。下面将以渐近回归模型为例来考察维数(即未知参数的个数)和采样区间对四种改进PSO算法性能的影响,接着以Logistic模型为例来分析研究数据噪声对四种改进PSO算法性能的影响。

1.维数对算法性能的影响

利用渐近回归模型和参数组合α=70.0,β=25.0,γ=0.6在采样区间内随机采样20个样本点生成模拟数据。本节利用四种PSO算法对模拟数据分别进行1、2、3维参数估计,即在α,β,γ三个参数中,分别只有1、2、3个参数未知,也就是在进行估计时分别固定其中2、1、0个参数。将各算法的总函数评价次数固定为4×103,分别对不同维数下的参数估计问题独立运行MPSO、IPSO2、IPSO3和DPSO算法各10次。四种PSO算法的若干参数设置和前述章节基本一致,α,β,γ的搜索区间分别为[0,100]、[0,100]和[0,1.0],各算法的迭代次数均为200。

表6.14至表6.17中所列出的分别是四种PSO算法所估计得到的参数α,β,γ和最小二乘J以及各自的标准差,每个单元格中下面的数据是标准差,“—”表示此列的参数已知并被赋予某个固定值,即此参数不是待估计参数。通过观察四张参数估计统计表可知,在待估计参数维数为1和2时,MPSO算法和IPSO2算法收敛的精度和标准差的数量级基本一样,而IPSO3算法和DPSO算法基本一样,当维数为3时,DPSO算法获得的精度最高,MPSO算法次之,最后是IPSO2算法和IPSO3算法。随着待估计参数的维数逐渐增加,四种PSO算法获得的J的精度和标准差的数量级逐渐降低,但是各个算法仍然能有效地估计到真正的参数值。因此,可以做出如下结论:在低维参数估计时,参数维数的变化对PSO算法的性能有一定的影响,但不是特别显著,随着维数的逐渐增大,算法的迭代次数也就是函数评价次数必须适当地予以增加。

表6.14 MPSO算法的参数估计统计结果

img141

表6.15 IPSO2算法的参数估计统计结果

img142

表6.16 IPSO3算法的参数估计统计结果

img143

表6.17 DPSO算法的参数估计统计结果

img144

2.采样区间对算法性能的影响

利用渐近回归模型和参数组合α=70.0,β=25.0,γ=0.6分别在采样区间[0,3]、[5,15]、[0,20]内随机采样20个样本点生成模拟数据。本节利用四种PSO算法对生成的每一组模拟数据各运行10次,四种算法的参数设置仍然和前面的章节一样,迭代次数为200,所得的实验结果如表6.18、表6.19和图6.4至图6.7所示。表6.18中列出的是在不同采样区间下各算法在200代时获得的参数α,β,γ的估计值和标准差。表6.19中列出的是各算法在10次独立运行中获得最小二乘J的最好值、平均值和最差值。图6.4至图6.7依次是当采样区间为[0,20]时,α,β,γ和J的平均收敛曲线,其中横坐标为种群迭代次数,纵坐标依次为当前代最好参数α,β,γ和最小二乘J值。

表6.18 不同采样区间下参数α,β,γ的估计值及标准差

img145

表6.19 不同采样区间下关于J的统计结果

img146

续表

img147

img148

图6.4 α的收敛曲线

img149

图6.5 β的收敛曲线

img150

图6.6 γ的收敛曲线

img151

图6.7 J的收敛曲线

实验结果表明,当只在[0,3]区间内采样时,由于所取样本点不能很好地反映渐近回归模型的渐近形态,所以算法的稳定性没有在[0,20]时好。另外在[5,15]区间内采样时,此区间部分范围内的曲线已经趋于平缓,后两个参数β,γ已对模型的取值影响不大,也就是样本点无法反映曲线的形态。当在区间[0,20]内采样时,所取的样本点完好地反映了渐近回归模型的曲线形态,因此四种改进PSO算法均估计到了参数的实际值,并且四种算法的收敛速度也基本一致,在迭代到100代之后,四个算法均搜索到了真实的参数值,这可以从图6.4到图6.7得到印证。总的来说,由于在[0,3]和[5,15]区间内采样时,采样点不能充分反映模型的形态,四种PSO算法的性能都受到了一定的影响。当在区间[0,20]内采样时,四种PSO算法的结果非常稳定,并且具有相近的算法性能。

通过上述实验结果可以分析得出:在实际应用的过程中,实验的采样与模型的具体构造是密切相关的,在进行采样之前就必须充分地考虑数学模型的类型,以便在能充分反映模型曲线形态的区间内采样。

3.噪声对算法性能的影响

利用Logistic模型和参数组合α=48.0,β=6.0,γ=0.1在采样区间[0,100]内随机采样100个{(xi,yi)|yi=α/(1+exp (β-γxi)),i=1,2,…,100}样本点生成模拟数据。然后对(xi,yi)加入随机噪声,假设噪声满足高斯分布N(0,δ),则掺杂了噪声的数据集为{(img152,img153)|img154=xi+N(0,δ),img155=yi+N(0,δ)},i=1,2,…,100。下面将考察当δ分别取1E-2、1E-3、1E-4和1E-5这四种值时,即在不同噪声强度下,四种PSO算法估计真实参数的能力。δ取不同值时,四种PSO算法的最大迭代次数均设置为1 000,各算法均独立运行10次,其余参数的取值与前面的章节一致。表6.20至表6.23中所列出的是当δ取不同值时各种PSO算法所估计得到的参数α,β,γ和最小二乘J以及各自的标准差,单元格中下方的数据是标准差。图6.8至图6.11分别给出了四种PSO算法获得的α,β,γ和J的平均收敛曲线,其中横坐标为种群迭代次数,纵坐标依次为当前代最好参数组合α,β,γ和最小二乘J值。

从表6.20至表6.23以及图6.8至图6.11中所展现的实验结果,可以发现当δ的取值从1E-2降低到1E-5时,即噪声强度逐渐减小时,四种PSO算法估计到的参数值越来越接近真实的参数值,最小二乘J的值也越来越接近于零。另外,还就δ=0.1时做了实验,四种PSO算法得到的结果中总是有部分参数估计值远离真实的参数值。可做出如下分析和判断:若采样误差较小,噪声对PSO算法的性能没有显著影响,算法获得的参数估计值非常接近真实值,估计值的误差也可基本控制在1E-3数量级以内,因此,可以认为这四种PSO算法在估计非线性模型的参数时具有一定的抗噪能力。

表6.20 MPSO算法在不同噪声强度下α,β,γ和J的统计结果

img156

表6.21 IPSO2算法在不同噪声强度下α,β,γ和J的统计结果

img157

表6.22 IPSO3算法在不同噪声强度下α,β,γ和J的统计结果

img158

表6.23 DPSO算法在不同噪声强度下α,β,γ和J的统计结果

img159

img160

图6.8 MPSO算法在不同噪声强度下α,β,γ和J的收敛曲线

img161

图6.9 IPSO2算法在不同噪声强度下α,β,γ和J的收敛曲线

img162

图6.10 IPSO3算法在不同噪声强度下α,β,γ和J的收敛曲线

img163

图6.11 DPSO算法在不同噪声强度下α,β,γ和J的收敛曲线

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈