首页 理论教育 影响模式识别结果的因素

影响模式识别结果的因素

时间:2022-02-12 理论教育 版权反馈
【摘要】:既然模式识别模型也是统计模型,模式识别的结果自然也受建模样本的代表性及复杂程度的影响。因此,模式识别的分类准则不同时,其分类结果通常是不一样的。分类特征对于模式识别结果影响很大,当分类特征选取得合适时,可以获得良好的分类结果。近红外光谱因为包含样品有机基团的综合信息,无论是对烟叶部位还是产地进行识别,近红外模式识别模型均能获得良好的结果。

8.7.2 影响模式识别结果的因素

模式识别方法是根据多元统计分析对模式的相似程度进行评价,选择的模式特征不同、评价指标与评价准则不同时,得到的分类结果也不同。既然模式识别模型也是统计模型,模式识别的结果自然也受建模样本的代表性及复杂程度的影响。

例如,例8-11中采用相关系数度量样本的相似程度所得的聚类谱系图8-5与例8-12中采用欧氏距离度量相似程度所得的聚类谱系图8-6及图8-7不同。

8.5节介绍的一次计算成型法与最大生成树、最小生成树法的分类原则在本质上是相同的。当一次计算成形法采用相关系数或夹角余弦作为相似度度量指标时,其分类结果与采用相同相似指标的最大生成树法的结果必然相同;而当采用距离系数作为模式相似度度量指标时,其分类结果与采用相同距离指标的最小生成树法的结果相同。但特征投影分类的结果与上述三种无监督模式识别方法的结果不一定相同——因为特征投影的分类准则与这三种方法不同。因此,模式识别的分类准则不同时,其分类结果通常是不一样的。

分类特征对于模式识别结果影响很大,当分类特征选取得合适时,可以获得良好的分类结果。反之,若特征不能良好地体现类别特征,无论采用何种分类方法都很难获得好的分类结果。文献[13]中分别以烟叶中的主要化学成分的含量(尼古丁、总氮、总糖、还原糖、氯、钾)和近红外光谱为特征,采用IS-KNN模式识别方法进行烟叶产地和部位的识别。结果表明,采用近红外信息对烟叶产地的识别准确率为88%~95%,而采用6个化学指标为特征时的产地识别正确率只有61%~78%;但以近红外光谱和6个化学指标为特征时对同一产地烟叶部位预测的准确率分别为82%~87%与80%~93%,两种信息来源对烟叶部位预测的正确率差异很小。

这一工作表明烟叶的主要化学成分含量较好地反映了烟叶的部位特征,采用化学指标可以对烟叶部位进行良好分类,但是采用这些化学指标进行烟叶产地识别时,结果却很差。这说明这6个化学指标不能良好地体现烟叶产地风格特征,因此以这几个化学指标作为模式特征进行烟叶产地识别无法得到理想效果。近红外光谱因为包含样品有机基团的综合信息,无论是对烟叶部位还是产地进行识别,近红外模式识别模型均能获得良好的结果。

由此可见,仅仅掌握了模式识别的方法是不够的,要正确解决实际问题中的模式识别问题,还需要有良好的专业知识与分析问题的能力,能从复杂的现象中找出对分类起主要作用的特征,是成功进行模式识别的决定因素。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈