首页 理论教育 化学模式识别

化学模式识别

时间:2022-02-12 理论教育 版权反馈
【摘要】:计算机模式识别实现了部分脑力劳动自动化。这一类模式识别与化学有密切关系,都属于化学模式识别的研究范畴。分析化学家利用药材的色谱或光谱等化学谱图来表征中药材的品质,根据这些谱图利用模式识别的方法进行中药材的真伪及道地性鉴定,就是化学模式识别方法在中药材质量评价和管理中的应用。借助于该模式识别模型,可以根据发样中痕量元素的含量,对个旧地区人群进行肺癌的早期诊断。

8.1.1 化学模式识别

模式识别(Pattern Recognition)是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别、评价的过程。

从数学角度而言,模式识别也是一个数学建模过程。只不过它给出的是定性结论而不是定量指标。

模式识别包括两个阶段,即学习(建模)阶段和实现(预测)阶段,前者是对样本进行特征选择,寻找分类的规律,后者是根据分类规律对未知样本集进行分类和识别。

广义的模式识别属计算机科学中智能模拟的研究范畴,内容非常广泛,包括声音和语言识别、文字识别、指纹识别、声呐信号和地震信号分析、照片图片分析、化学模式识别等。计算机模式识别实现了部分脑力劳动自动化。

模式识别给出的是统计和经验的规律,无法提供关于样本的机理理论模型。

计算机模式识别可用来进行有机结构解析、研究定量构效关系、识别真伪商品、追踪污染源、进行药物分类、临床诊断、矿物普查、考古研究、材料设计等。这一类模式识别与化学有密切关系,都属于化学模式识别的研究范畴。

例如,中药材在特定产地种植并在特定采摘期采收时,其质量和药效才能得以保障,这样的中药材通常称为“道地”药材。分析化学家利用药材的色谱光谱等化学谱图来表征中药材的品质,根据这些谱图利用模式识别的方法进行中药材的真伪及道地性鉴定,就是化学模式识别方法在中药材质量评价和管理中的应用。

图8-1是来自四个不同产地的穿心莲药材的色谱指纹图谱,显然,四张图谱总体特征相似,但不同样品的某些具体的峰(如8号、17号峰)面积或峰高仍有区别。正是这些差异构成了药材品质的不同,使我们能够借助化学图谱和模式识别方法进行药材的真伪或道地性鉴定。

img695

图8-1 不同产地穿心莲药材的色谱指纹图谱(横坐标:保留时间/min;纵坐标:信号强度/μAu)

例8-1 用化学模式识别进行茶叶分级。

以1988年商业部颁布的4套6个等级的炒青绿茶作为标准样,选取茶叶中的氨基酸、咖啡碱、水浸出物、粗纤维、叶底、茶汤等10个理化指标作为特征量,建立模式识别模型,编成计算机茶叶品质评定软件包。

对未知等级的茶叶进行评定时,将其10个特征理化指标值输入计算机,计算机便按照建好的模式识别模型和这10个输入的特征量值,自动评定它们的等级。表8-1为对6个市售茶叶样品的分级结果。

表8-1 6个市售茶叶样品模式识别分类结果

img696

注:后验概率指已知级别的样品落入应落入那一级别的概率。

例8-2 用化学模式识别判别化妆品的真伪。

为鉴定送检的3瓶市售某品牌化妆品的真伪,从中取出少量样品,置于广口瓶中,放入一根吸附丝,在30℃吸附样品放出的气体2h后,取出吸附丝放入居里点裂解器中加热,将吸附的挥发气体导入毛细管气相色谱仪进行测定,定性分析检测出21个组分,这21个指标再加上总挥发量,共计22个指标。

分析在过去一年内生产的24个该品牌真品。对其22个指标进行简单相关分析,发现有些指标之间的相关性很好,这样就不必将所有指标列出,只需在相关性好的一类指标中选择1个或2个贡献最大的指标。最终从22个指标中选择了1,2-二甲苯、蒈烯、邻散化烃、对邻散化烃、苎烯、1,2-二甲基-2-乙基苯、萘和一个未定性的组分等8个指标作为该化妆品的特征指标。

将24个真品记为1~24号,3个市售样品记为25~27号。将27个样品的8个特征指标输入到计算机中,进行聚类分析,得到聚类谱系图(图8-2)。

由图8-2可知,在相似度低于0.98时编号为25、26和27的3个市售产品自成一类,与其他真品不同类。可以判定这3个化妆品均为赝品。

img697

图8-2 27个化妆品聚类分析谱系

例8-3 利用化学模式识别进行计算机辅助癌症诊断。

从云南个旧(肺癌高发区)地区采集117例人的头发样品,其中67例健康人,22例肺癌早期患者和28例肺癌患者。用原子吸收分光光度法和示波催化极谱等方法测定发样中的硒、锌、铜、铬、镉、砷、铅和锡等8种痕量元素。

经考察,发样中痕量元素硒、锌、铬、镉、砷的含量与肺癌有关系。选取这5种元素的含量为特征,建立模式识别模型,得到痕量元素含量和肺癌关系非线性映射如图8-3所示。在该图中,健康人、癌症初期患者和癌症患者三种类型发样分别位于不同的区域。对肺癌早期诊断的正确率可达到80%以上。借助于该模式识别模型,可以根据发样中痕量元素的含量,对个旧地区人群进行肺癌的早期诊断。

img698

图8-3 人发5种痕量元素含量和肺癌关系的非线性映射

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈