首页 理论教育 无监督模式识别法

无监督模式识别法

时间:2022-02-12 理论教育 版权反馈
【摘要】:对于另一类不需要训练集,对所研究的模式进行适当分类的问题则需要用无监督模式识别方法,聚类分析法是一种无监督的模式识别方法。聚类分析法是根据研究对象的多种特征在数值上存在的相似程度,将它们聚合为不同点群的一种多元统计法。一类是对样品进行分类,称为Q型聚类分析;另一类是对变量进行分类,称为R型聚类分析。

8.5 无监督模式识别

判别分析需要有已知分类的模式作为训练集,获得判别函数(依据)后,用其判断未知模式的类属,是有监督的模式识别法。对于另一类不需要训练集,对所研究的模式进行适当分类的问题则需要用无监督模式识别方法,聚类分析法(Clustering analysis method)是一种无监督的模式识别方法。

聚类分析法是根据研究对象(样品或变量)的多种特征在数值上存在的相似程度,将它们聚合为不同点群的一种多元统计法。其基本思想是,从一批样品的多个观测指标中,找出能度量样品之间相似程度的统计量,构成一个对称的相似矩阵。在此基础上进一步寻找各样品和变量之间的相似程度,并按其相似程度的大小,将样品或变量逐一归类。关系密切的聚集到一个小的分类单位,关系疏远的聚集到一个大的分类单位,直到所有样品或变量都聚集完毕,形成一个亲疏关系谱系图,用来直观地显示被分类对象的差异和联系。

聚类分析可以和其他统计方法结合使用,例如变量很多时,在进行回归分析前,可以先对变量进行聚类,再从每类中挑选一个最有代表性的变量参加回归分析。又如在进行判别分析以前先对特征变量进行聚类,再从中挑出有代表性的变量用于判别分析。聚类分析按其研究对象的不同可分为两类。一类是对样品进行分类,称为Q型聚类分析;另一类是对变量进行分类,称为R型聚类分析。

如例8-2中对化妆品进行化学模式识别前,先对检测到的21个化学组分含量进行相似性分析,从相似度高的变量中抽出1个变量作为模式特征,就是先对变量进行聚类分析(R型聚类分析)后再对样品(化妆品)进行模式识别(Q型聚类分析)。

聚类分析的基本步骤如下。

步骤1:数据预处理

常用的特征变量预处理公式见式(2-24)~式(2-29)。

步骤2:相似性统计量(量度)的计算

相似性统计量的计算公式见式(8-6)~式(8-12)。

步骤3:聚类分析

根据步骤2计算而得的相似性统计量,可对模式样本进行相似归类,方法有很多,本节仅介绍以下三种。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈