首页 百科知识 同义词挖掘系统设计与实现

同义词挖掘系统设计与实现

时间:2022-02-27 百科知识 版权反馈
【摘要】:7.4.2 同义词挖掘系统设计与实现同义词挖掘系统设计从前面的分析可以看出,基于《词林》的同义词识别方法是一种利用现有的语义体系,来对任何两个词汇进行语义相似度计算的方法。如何从语料库中自动挖掘具有同义关系的词对,从而构建同义词词库是同义词挖掘系统的目标所在。系统主要分为同义词测试、同义词挖掘和数据库维护三个部分。同义词挖掘:同义词挖掘界面如图7-9所示。提供多文件挖掘和单文件挖掘功能。
同义词挖掘系统设计与实现_文本自动标引与自动分类研究

7.4.2 同义词挖掘系统设计与实现

(1)同义词挖掘系统设计

从前面的分析可以看出,基于《词林》的同义词识别方法是一种利用现有的语义体系,来对任何两个词汇进行语义相似度计算的方法。如何从语料库中自动挖掘具有同义关系的词对,从而构建同义词词库是同义词挖掘系统的目标所在。本系统由于时间限制,仅将语料库界定在关键词记录型文件。系统流程如图7-5所示。

系统主要分为同义词测试、同义词挖掘和数据库维护三个部分。具体结构如图7-6所示。

img88

图7-5 同义词挖掘系统流程图

img89

图7-6 同义词挖掘系统结构图

(2)同义词挖掘系统简介

同义词挖掘系统运行主界面如图7-7所示,包括同义词测试、同义词挖掘和数据库维护三个模块。同义词测试:提供词汇之间的语义相似度计算功能。同义词测试界面如图7-8所示。同义词挖掘:同义词挖掘界面如图7-9所示。提供多文件挖掘和单文件挖掘功能。数据库维护:提供同义词挖掘所用的数据库的维护界面,如图7-10所示,主要包括义类库维护、相关词维护、释义库维护和缩略语维护四个模块。

img90

图7-7 同义词挖掘系统界面

img91

图7-8 同义词测试界面

img92

图7-9 同义词挖掘界面

img93

图7-10 同义词挖掘用数据库维护界面

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈