首页 理论教育 模式识别方法的分类

模式识别方法的分类

时间:2022-02-12 理论教育 版权反馈
【摘要】:模式识别的任务就是要找出所研究对象的分布特点,根据其特征对其进行分类或预报未知样本的类属。模式识别的数学方法很多,可以分成两大类:统计模式识别与句法模式识别。统计模式识别是将每个样本用若干个特征参数表示为模式空间的一个点,根据各点的距离或其他函数来对样本进行判别、分类,并利用分类结果预报未知。统计模式识别又可分为参数统计模式识别与非参数统计模式识别。

8.1.4 模式识别方法的分类

在模式识别中,我们要处理的关系有三个:变量和变量之间;样本和样本之间;变量与样本之间的关系。模式识别理论认为,p个特征包含了所讨论样本分类性质的重要信息,样本在模式空间中的分布是“物以类聚”的,即不同性质的样本点分布在模式空间的不同区域中,相同性质的点聚集在同一区域。模式识别的任务就是要找出所研究对象的分布特点,根据其特征对其进行分类或预报未知样本的类属。

模式识别的数学方法很多,可以分成两大类:统计模式识别与句法模式识别(Syntactic Pattern Recognition)。句法模式识别是以模式结构信息为对象的识别技术,在图像处理、指纹分析、汉字识别等方面应用广泛。由于化学领域处理的大都是以数字方式存储的实验或者图谱数据,本章只介绍处理以数字为特征的模式识别方法——统计模式识别方法。

统计模式识别是将每个样本用若干个特征参数表示为模式空间的一个点,根据各点的距离或其他函数来对样本进行判别、分类,并利用分类结果预报未知。如按分类系统输出结果的性质,又可分为有监督分类和无监督分类两种。其过程如下

img699

有监督分类(Supervised Classification):事先规定分类的标准和种类的数目,通过大批已知样本和信息的处理找出规律(即得到判别函数),再预报所要判定的模式(对象)属于何类。

无监督分类(Unsupervised Classification):事先没有规定样本的类别标准,也没有规定分几类,要求通过信息处理找出合适的分类方法实现样本分类。

在工业优化、诊断、材料设计等应用中,主要使用有监督分类方法。而在化合物、矿石、地质勘探及某些需要集总分类的化学、化工问题中常采用无监督分类方法,如元素周期表分类、动植物分类都是典型的无监督分类实例。

统计模式识别又可分为参数统计模式识别与非参数统计模式识别。在参数统计模式识别中,要求各特征的概率分布类型是已知的(一般假设为正态分布),只是其中某些参数未知,这时的模式识别就是对这些未知参数进行识别。而非参数统计模式识别不需要事先知道各参数的概率分布,只是根据模式空间中各模式点之间的差别和联系,对模式空间进行分割,从而对未知模式进行判别和归类。

两类分类:模式识别中最简单的分类问题是将样本分为互不相容的两类(即第一类包括具有某种特征的样本,第二类包括所有其余样本)。由于模式识别是以“物以类聚”为基本假设,即具有相似性质的模式在模式空间中所处的位置较近,在空间形成一个“簇”。因此若在模式空间中能找到一个或一组超平面(超曲面)将其划分为不同的(簇),则称这个模式空间具有可分性。若模式空间可用一个超平面划分,则称这个模式空间为线性可分的,该超平面称为判别平面。

多类分类:需要将样本划分为多类的分类问题,在化学上也是常见的,如同一价型的化合物往往有多种晶型,这时晶型的分类就是多类分类。多类分类比两类分类复杂,有时可用多次两类分类处理以实现多类分类。也可采用其他专门方法进行多类分类,如K最近邻法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈