首页 百科知识 简述如何使用节点修改模板的形状

简述如何使用节点修改模板的形状

时间:2022-11-01 百科知识 版权反馈
【摘要】:,指定支持向量机目标函数中参数C的值,默认为10,较为合理的值在1~10之间。关于核函数的选取没有确定的标准,通常采取的方法是,一次选取这四个核函数进行比较,并进行择优。增加RBFγ值可能会提高模型的精度,同时可能会导致过拟合。SVM基于结构风险最小化原则,也就是在处理小样本的分类或者回归问题优势明显。本次以预测A井目的层段致密砂砾岩岩性为例,来详细介绍SVM的使用。在选项卡设置SVM模型的高级参数。

2.2.1.1 SVM界面介绍

IBM SPSS Modeler18.0提供了SVM节点,如图2-37。

图2-37 IBM SPSS Modeler18.0的SVM节点图示

SVM节点设置

SVM节点的参数设置包括【注释】【分析】【专家】【模型】【字段】5张选项卡,如图2-38。

【字段】选项卡,主要用来规定模型的输入变量和目标变量。

图2-38 【SVM】的【字段】选项卡界面

【专家】选项卡,用来设置SVM模型的高级参数,如图2-39。

【模式】指的是SVM建立模型的形式,即按照系统的默认参数建立SVM模型,还是手动设置参数建立SVM模型,包括【简单】和【专家】两个部分。其中,【简单】代表的是以系统的默认参数建立SVM模型;【专家】代表的是手动设置参数建立SVM模型。

选择【专家】选项卡。

【追加所有概率(仅对于分类目标有效)】,表示的是在利用支持向量机分类时,在该项画钩表示计算输出变量取所有类别值的概率,否则只是计算取某个类别值的概率。

【停止标准】,指的是设置求解过程中迭代停止的条件参数,默认的是0.001,最小值是0.000 001。具体解释如下:如果采用经典的二次规划方法求解参数,同时求解m个拉格朗日乘子,将会涉及很多次迭代,计算开销很大,因此,Modeler采用SMO(Sequential Minimal Optimization)算法求解。其基本思路如下:每次只是更新两个乘子,迭代获得最终解。该选项指定乘子更新小于该值时,迭代停止;减少该值,模型精度会得到改善,但是建模时间会延长。

【正则化参数】,指定支持向量机目标函数中参数C的值,默认为10,较为合理的值在1~10之间。增加该值将会改善模型的精度,但是可能会导致过拟合。

【回归精确度(epsilon)】,指定支持向量机中的ε值。

【内核类型】,指定支持向量机选取的核函数,包括RBF、多项式、Sigmoid、线性,默认为RBF,如图2-40。关于核函数的选取没有确定的标准,通常采取的方法是,一次选取这四个核函数进行比较,并进行择优。

【RBF伽马】,设置RBFγ值,其经验值在3/n~6/n之间,n表示输入变量的个数。增加RBFγ值可能会提高模型的精度,同时可能会导致过拟合。

【伽马】,当选择的核函数是多项式或者Sigmoid核函数时,应该指定参数γ的值,默认值为1。

【偏差】,当选择的核函数是多项式或者Sigmoid核函数时,应该指定偏差r的值,默认值为0。

【度】,当选择的核函数为多项式核函数为多项式核函数时,应该指定结束d的值,以确定映射空间的维度,通常该值需要小于10。

图2-39 【SVM】的【专家】选项卡

图2-40 【SVM】的【专家】选项卡中【内核类型:】的选项

2.2.1.2 简单例子

SVM基于结构风险最小化原则,也就是在处理小样本的分类或者回归问题优势明显。本次以预测A井目的层段致密砂砾岩岩性为例,来详细介绍SVM的使用。

SVM岩性预测模型建立的具体操作如下:

本次利用的数据是A井目的层段测井和岩性数据。

插入【变量】节点(位于节点选用板的【源】中,如图2-41)、【类型】节点(位于节点选用板的【字段选项】中,如图2-42)、【分区】节点(位于节点选用板的【字段选项】中,如图2)和【SVM】节点(位于节点选用板的【建模】中的【分类】中,如图2-43),依次连接,SVM岩性预测模型流初步设置成功,如图2-44。

图2-41 节点选用板的【源】界面

图2-42 节点选用板的【字段选项】界面

图2-43 节点选用板的【建模】中的【分类】界面

图2-44 初步建立的SVM岩性预测模型流

【变量】节点设置:

【变量】节点用来导入分析数据。双击【变量】节点,出现【变量】节点的【浏览文件】界面,单击【浏览文件】(图2-45),选择目标分析数据,点击【打开】(图2-46),可以看到目标文件导入到了变量节点(图2-47),点击【应用】,分析数据导入成功。

图2-45 【变量】节点的【文件】界面(数据未输入)

图2-46 【变量】节点的【浏览文件】界面

图2-47 【变量】节点的【文件】界面(数据已经输入)

【类型】节点设置:

【类型】节点用来设置输入变量和目标变量的【测量】和【角色】。AC、CALI、CNL、DEN、GR、PORE、RI、RT、RXO、VCL属于输入变量,为数值型,其【角色】设置为【输入】,【测量】设置为连续;岩性变量属于目标变量,为分类型,其角色设置为【目标】,【测量】设置为【名义】(图2-48),点击【应用】,设置成功。

图2-48 【类型】节点界面

【分区】节点设置:

【分区】节点可以把样本数据分成训练集和测试集。选择【训练和测试(T)】,设置【训练分区大小】为90,【测试分区大小】为10(图2-49),点击【应用】,设置成功。

图2-49 【分区】节点界面

【SVM】节点设置:

【SVM】节点用来建立SVM预测模型。

在【字段】选项卡中设置【输入】和【目标】变量,本次选择【使用预定义角色(D)】(图2-50)。

图2-50 【SVM】节点的【字段】选项卡界面

在【模型】选项卡中(图2-51),选择【使用分区数据】和【为每个分割构建模型】。

图2-51 【SVM】节点的【模型】选项卡界面

在【专家】选项卡(图2-52)设置SVM模型的高级参数。首先选择【专家】,表示手动设置SVM的高级参数;在【追加所有概率(仅对于分类目标有效)】上画钩,也就是在利用支持向量机分类时,计算输出变量取所有类别值的概率;设置【停止标准】为0.001(注意:减少该值,模型精度会得到改善,但是建模时间会延长);设置【正则化参数】为10,也就是设置支持向量机目标函数中参数C的值(注意:较为合理的值在1~10之间,增加该值将会改善模型的精度,但是可能会导致过拟合);设置【回归精确度(epsilon)】为0.1,即规定支持向量机中的ε值为0.1;设置【内核类型】为多项式(关于核函数的选取没有确定的标准,通常采取的方法是,一次选取这四个核函数进行比较,并进行择优);设置【伽马】为1.0;设置【偏差】为0.0;设置【度】为3。

图2-52 【SVM】节点的【专家】选项卡界面

在【分析】选项卡界面中选择【计算预测变量重要性】(图2-53)。

图2-53 【SVM】节点的【分析】界面

点击运行,生成SVM模型运行结果(图2-54);同时为了方便的分析预测结果的准确性,添加分析节点,如图2-55。

图2-54 含有模型运行结果的SVM岩性预测模型流(钻石形状的节点为模型运行结果)

2-55 含有【分析】节点的SVM岩性预测模型流

双击【分析】节点,点击【运行】(图2-56),得到模型的分析结果(图2-57)。其中,【1_培训】代表训练集,【1_测试】代表测试集;从分析结果可以轻易看到,训练集的预测准确性为95.35%,测试集的预测准确性为81.25%,说明模型的预测精度高,泛化能力强,能较准确地区分砂砾岩和泥岩。

图2-56 【分析】节点的【分析】界面

图2-57 【分析】结果界面

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈