首页 百科知识 基于领域本体的语义检索系统的检索应用

基于领域本体的语义检索系统的检索应用

时间:2022-02-27 百科知识 版权反馈
【摘要】:语义关系判断在基于领域本体的语义检索系统中,用户输入的检索词不再是孤立的,毫无语义联系的,而是系统会自动计算检索词之间的语义联系,判断用户的检索意图。在文本的检索系统中,首先计算三个关键词之间是否有语义关联,根据三者之间的语义联系找到检索结果,以下是系统检索“华东地区收藏的齐民要术的版本”的检索结果。
基于领域本体的语义检索系统的检索应用_领域本体的半自动构建及检索研究

6.5 基于领域本体的语义检索系统的检索应用

由于本体论是对特定领域内的概念及概念关联的形式化表示,具有较强的语义属性,因而,利用本体论可以克服传统信息检索割裂词间语义关系的弱点,较好地解决因简单关键词匹配带来的“信息过载”、“形义不符”等问题,并在一定程度上实现基于知识、语义的检索。

6.5.1 基于语义的知识检索

所谓知识检索,就是综合运用信息管理科学、人工智能、语言学等多学科的理论与技术,基于知识充分表达和优化用户需求,能高效存取知识源,并能准确精选用户需要的结果。传统的信息检索对于数据检索、精确提问等无法给出精确的回答,检索的结果是一段文本,用户需要从其中提取出自己需要的知识,而知识检索可以得出精确的检索结果,可以将繁重的知识信息提取工作由用户转移给计算机。

1 关键词检索方式

关键词检索方式就是目前搜索引擎所使用的检索方式,即用户将自己的检索要求用几个关键词来表达。本研究的语义检索可以检索检索词语义判断、同义关系检索、属性检索以及上下位等特性检索。

(1)语义关系判断

在基于领域本体的语义检索系统中,用户输入的检索词不再是孤立的,毫无语义联系的,而是系统会自动计算检索词之间的语义联系,判断用户的检索意图。这是与传统的基于关键词匹配的检索的最大不同之处。例如,用户的检索词“华东地区齐民要术版本”,传统的检索方式是用“华东地区”+“齐民要术”+“版本”三个关键词去检索资源库中进行字面的匹配,而不考虑词间的语义关系。在文本的检索系统中,首先计算三个关键词之间是否有语义关联,根据三者之间的语义联系找到检索结果,以下是系统检索“华东地区收藏的齐民要术的版本”的检索结果。

img93

图6-11 语义关系检索结果图

(2)同义关系控制

汉语中存在着许多同义词,一个词义可以采用多个词形来进行表达,例如,土豆又称马铃薯。在农学领域中,同时还存在着大量古今名称的现象,例如,紫金山古名麦山,这对于农史领域的初学者来说,在文献的查找过程中,无形增加了些许的困难。在本文的语义检索系统中,可以进行同义词控制(包括古名今名控制),用户只要输入检索事物的一个名称即可得到该事物的所有称呼。例如,输入“马铃薯”,可以得到马铃薯所有的别称。

img94

图6-12 同义词检索结果图

(3)上下位关系控制(实例检索)

有些用户的检索需求经常用一个宽泛的概念去表示,该概念还有众多的下位概念,例如,某用户检索“中国农业遗产研究室的农史专家”,在一般的检索系统中只能用“中国农业遗产研究室农史专家”去进行字面匹配,而在本文的语义检索系统中,可以检索出“中国农业遗产研究室的农史专家”的下属概念,该检索结果如图所示:

img95

图6-13 上下位关系检索结果

(4)语义属性检索

例如,甘薯适应在哪种土地种植?

img96

图6-14 语义属性检索结果

2 自然语言提问检索方式

目前的检索系统大都面向普通的大众用户,并非所有的大众用户都对信息检索的专业知识了解,因此,对于关键词的检索方式,有些用户对关键词和停用词未必区分的很好,而用户更习惯于采用自然语言的提问方式进行检索。在本文的语义检索系统中,允许用户采用自然语言提问的方式进行检索,例如,检索“华东地区收藏的齐民要术的版本”,就可以采用自然语言提问的方式——“华东地区收藏了《齐民要术》的哪些版本呢?”,系统可以同样返回和输入关键词检索同样的检索结果。

img97

图6-15 自然语言检索结果1

例如,检索“贾思勰的籍贯是哪”。

img98

图6-16 自然语言检索结果2

6.5.2 基于语义的文本检索

文本资料的查找是进行农史研究的基础工作,本文的语义检索系统由于本体的支持,可以从语义层面判断概念间的关系,在一定程度上提高了资料检索的效率和效果,节省农史研究者的时间和精力。主要的检索机制是在上文知识检索结果的基础上,用知识检索的结果再去检索文本资源库,就可以得到用户需要检索的文档结果集,即首先利用检索词对领域本体库进行检索,得到领域本体库中间检索结果,再去对文本资源库进行检索得到最后的检索结果。基于语义的文本检索,提供了关键词和自然语言两种检索方式供使用。

1 关键词检索方式

基于语义的关键词方式的文本检索,根据用户输入的关键词组合,首先判断检索词之间的语义关系,对于语义关系的判断,同6.5.1中的知识检索相同,可以进行统一关系、等级关系以及属性关系等的控制,得到关键词组合的知识检索结果,也就是用户的语义检索结果,然后用这个“真正的”检索结果再去检索文本资源库,从而得到用户的检索结果。例如,用户检索“中国农业遗产研究室农史专家”,首先会得到“李长年、缪启愉、郭文韬、王思明、章楷”等的中间检索结果,再去对文本资源库进行检索,检索结果如图6-17所示。

img99

图6-17 语义关系关键词方式文本检索结果

“整地农具”的文本检索结果如图6-18所示。

img100

图6-18 上下位关系关键词方式文本检索结果

2 自然语言提问方式

自然语言提问方式的基于语义的文本检索,则是针对一些缺乏信息检索基础知识的初级用户而设置的检索方式,允许用户采用自然语言提问的方式进行语义检索,检索的基本机制同6.5.1中的自然语言提问的知识检索,把知识检索的检索结果作为中间检索结果再对文本资源库进行进一步的检索。例如,检索提问“论述宋代农作物栽培的专业论文有哪些”的检索结果如图6-19所示。检索提问“中国农业遗产研究室的农史专家撰写的专业论文有哪些”的检索结果仍然同图6-19所示。

img101

图6-19 自然语言提问方式文本检索结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈