简述如何使用节点修改模板的形状

时间：2024-11-01 百科知识版权反馈

【摘要】：，指定支持向量机目标函数中参数C的值，默认为10，较为合理的值在1～10之间。关于核函数的选取没有确定的标准，通常采取的方法是，一次选取这四个核函数进行比较，并进行择优。增加RBFγ值可能会提高模型的精度，同时可能会导致过拟合。SVM基于结构风险最小化原则，也就是在处理小样本的分类或者回归问题优势明显。本次以预测A井目的层段致密砂砾岩岩性为例，来详细介绍SVM的使用。在选项卡设置SVM模型的高级参数。

2.2.1.1　SVM界面介绍

IBM SPSS Modeler18.0提供了SVM节点，如图2-37。

pagenumber_ebook=57,pagenumber_book=48

图2-37　IBM SPSS Modeler18.0的SVM节点图示

SVM节点设置

SVM节点的参数设置包括【注释】【分析】【专家】【模型】【字段】5张选项卡，如图2-38。

【字段】选项卡，主要用来规定模型的输入变量和目标变量。

pagenumber_ebook=58,pagenumber_book=49

图2-38　【SVM】的【字段】选项卡界面

【专家】选项卡，用来设置SVM模型的高级参数，如图2-39。

【模式】指的是SVM建立模型的形式，即按照系统的默认参数建立SVM模型，还是手动设置参数建立SVM模型，包括【简单】和【专家】两个部分。其中，【简单】代表的是以系统的默认参数建立SVM模型；【专家】代表的是手动设置参数建立SVM模型。

选择【专家】选项卡。

【追加所有概率（仅对于分类目标有效）】，表示的是在利用支持向量机分类时，在该项画钩表示计算输出变量取所有类别值的概率，否则只是计算取某个类别值的概率。

【停止标准】，指的是设置求解过程中迭代停止的条件参数，默认的是0.001，最小值是0.000 001。具体解释如下：如果采用经典的二次规划方法求解参数，同时求解m个拉格朗日乘子，将会涉及很多次迭代，计算开销很大，因此，Modeler采用SMO（Sequential Minimal Optimization）算法求解。其基本思路如下：每次只是更新两个乘子，迭代获得最终解。该选项指定乘子更新小于该值时，迭代停止；减少该值，模型精度会得到改善，但是建模时间会延长。

【正则化参数】，指定支持向量机目标函数中参数C的值，默认为10，较为合理的值在1～10之间。增加该值将会改善模型的精度，但是可能会导致过拟合。

【回归精确度（epsilon）】,指定支持向量机中的ε值。

【内核类型】，指定支持向量机选取的核函数，包括RBF、多项式、Sigmoid、线性，默认为RBF，如图2-40。关于核函数的选取没有确定的标准，通常采取的方法是，一次选取这四个核函数进行比较，并进行择优。

【RBF伽马】，设置RBFγ值，其经验值在3/n～6/n之间，n表示输入变量的个数。增加RBFγ值可能会提高模型的精度，同时可能会导致过拟合。

【伽马】，当选择的核函数是多项式或者Sigmoid核函数时，应该指定参数γ的值，默认值为1。

【偏差】，当选择的核函数是多项式或者Sigmoid核函数时，应该指定偏差r的值，默认值为0。

【度】，当选择的核函数为多项式核函数为多项式核函数时，应该指定结束d的值，以确定映射空间的维度，通常该值需要小于10。

pagenumber_ebook=59,pagenumber_book=50

图2-39　【SVM】的【专家】选项卡

pagenumber_ebook=59,pagenumber_book=50

图2-40　【SVM】的【专家】选项卡中【内核类型：】的选项

2.2.1.2　简单例子

SVM基于结构风险最小化原则，也就是在处理小样本的分类或者回归问题优势明显。本次以预测A井目的层段致密砂砾岩岩性为例，来详细介绍SVM的使用。

SVM岩性预测模型建立的具体操作如下：

本次利用的数据是A井目的层段测井和岩性数据。

插入【变量】节点（位于节点选用板的【源】中，如图2-41）、【类型】节点（位于节点选用板的【字段选项】中，如图2-42）、【分区】节点（位于节点选用板的【字段选项】中，如图2）和【SVM】节点（位于节点选用板的【建模】中的【分类】中，如图2-43），依次连接，SVM岩性预测模型流初步设置成功，如图2-44。

pagenumber_ebook=60,pagenumber_book=51

图2-41　节点选用板的【源】界面

pagenumber_ebook=60,pagenumber_book=51

图2-42　节点选用板的【字段选项】界面

pagenumber_ebook=60,pagenumber_book=51

图2-43　节点选用板的【建模】中的【分类】界面

pagenumber_ebook=60,pagenumber_book=51

图2-44　初步建立的SVM岩性预测模型流

【变量】节点设置：

【变量】节点用来导入分析数据。双击【变量】节点，出现【变量】节点的【浏览文件】界面，单击【浏览文件】（图2-45），选择目标分析数据，点击【打开】（图2-46），可以看到目标文件导入到了变量节点（图2-47），点击【应用】，分析数据导入成功。

pagenumber_ebook=61,pagenumber_book=52

图2-45　【变量】节点的【文件】界面（数据未输入）

pagenumber_ebook=61,pagenumber_book=52

图2-46　【变量】节点的【浏览文件】界面

pagenumber_ebook=62,pagenumber_book=53

图2-47　【变量】节点的【文件】界面（数据已经输入）

【类型】节点设置：

【类型】节点用来设置输入变量和目标变量的【测量】和【角色】。AC、CALI、CNL、DEN、GR、PORE、RI、RT、RXO、VCL属于输入变量，为数值型，其【角色】设置为【输入】，【测量】设置为连续；岩性变量属于目标变量，为分类型，其角色设置为【目标】，【测量】设置为【名义】（图2-48），点击【应用】，设置成功。

pagenumber_ebook=62,pagenumber_book=53

图2-48　【类型】节点界面

【分区】节点设置：

【分区】节点可以把样本数据分成训练集和测试集。选择【训练和测试（T）】，设置【训练分区大小】为90，【测试分区大小】为10（图2-49），点击【应用】，设置成功。

pagenumber_ebook=63,pagenumber_book=54

图2-49　【分区】节点界面

【SVM】节点设置：

【SVM】节点用来建立SVM预测模型。

在【字段】选项卡中设置【输入】和【目标】变量，本次选择【使用预定义角色（D）】（图2-50）。

pagenumber_ebook=63,pagenumber_book=54

图2-50　【SVM】节点的【字段】选项卡界面

在【模型】选项卡中（图2-51），选择【使用分区数据】和【为每个分割构建模型】。

pagenumber_ebook=64,pagenumber_book=55

图2-51　【SVM】节点的【模型】选项卡界面

在【专家】选项卡（图2-52）设置SVM模型的高级参数。首先选择【专家】，表示手动设置SVM的高级参数；在【追加所有概率（仅对于分类目标有效）】上画钩，也就是在利用支持向量机分类时，计算输出变量取所有类别值的概率；设置【停止标准】为0.001（注意：减少该值，模型精度会得到改善，但是建模时间会延长）；设置【正则化参数】为10，也就是设置支持向量机目标函数中参数C的值（注意：较为合理的值在1～10之间，增加该值将会改善模型的精度，但是可能会导致过拟合）；设置【回归精确度（epsilon）】为0.1，即规定支持向量机中的ε值为0.1；设置【内核类型】为多项式（关于核函数的选取没有确定的标准，通常采取的方法是，一次选取这四个核函数进行比较，并进行择优）；设置【伽马】为1.0；设置【偏差】为0.0；设置【度】为3。

pagenumber_ebook=64,pagenumber_book=55