首页 理论教育 基于本体的知识检索模型和策略

基于本体的知识检索模型和策略

时间:2022-03-04 理论教育 版权反馈
【摘要】:基于本体的知识组织为基于语义内容的知识检索提供了基础,但是为了实现高效的知识检索,还必须具有相应的检索模型、方法和策略。本节将进一步构建基于本体的知识检索的整体模型,并深入研究相关的检索方式和技术,以实现对深层知识内容的检索,并提高检准率和检全率。在基于本体的知识检索系统中,可以根据领域本体中的概念和关系对用户查询式进行扩展,这主要可以从两个方面来进行。

9.2.2 基于本体的知识检索模型和策略

基于本体的知识组织为基于语义内容的知识检索提供了基础,但是为了实现高效的知识检索,还必须具有相应的检索模型、方法和策略。本节将进一步构建基于本体的知识检索的整体模型,并深入研究相关的检索方式和技术,以实现对深层知识内容的检索,并提高检准率和检全率。为此,本系统采用如下检索策略:

(1)通过本体库中的概念关系对用户检索式进行优化。利用语言本体和领域本体中的语义关系和知识关系对用户检索式进行优化和扩展,使其能够更准确全面地反映用户需求。本系统设计了基于语言本体的查询式优化方法、基于领域本体的查询式扩展方法。

(2)实现基于概念的知识检索。本体知识库中包含了丰富的本体概念和各类知识对象,这些知识元素之间存在着各种语义关联,如层级关系、等同关系、相关关系等。利用这些语义关系,通过概念及概念空间的映射和匹配运算,可以实现概念、语义结构、知识对象的检索,设计的语义检索方法参见第5章,这里侧重介结绍索过程和步骤。

1.基于本体的知识检索模型

图9-2显示了基于本体的知识检索模型的基本结构

img89

图9-2 基于本体的知识检索模型

该模型由以下几个部分组成:用户界面代理,参照本体库(它为模型提供各类本体知识的概念模型、元数据和基本概念),检索代理,本体代理,本体对象库等。

(1)用户界面代理

用户界面代理的主要功能是对检索请求进行本体化。具体过程为:①接收到查询请求后,用户界面代理利用领域本体对其进行语义推理,并且与用户偏好本体库和专家经验本体库协作,筛选出符合用户特征的检索范围和相关的概念集,然后在用户界面上按照本体的表示形式提供用户选择;②用户选择最适合表达信息需求的检索范围和概念后,用户界面代理将其提交给检索代理;③当检索响应完成后,用户界面代理把检索结果返回给用户。

(2)用户偏好本体库

用户偏好本体库是实现个性化信息检索的重要构件。用户偏好本体库的主要功能是用来存储和核查用户信息需求的基本特征和属性,帮助确定用户检索词在本体中的位置。在用户输入检索词后,系统将根据检索词和相应的用户偏好本体,帮助用户界面代理选择与用户最相关的领域本体,这样既可以缩短搜索的时间,又可以提高检准率。如果在用户偏好本体的相同或者相关的概念中含有以前的检索方案信息,那么可以直接将有关概念显示给用户选择。另外用户偏好本体库应具有一定的学习和反馈功能,以便动态地反映用户检索兴趣所在的偏好需求。

(3)专家经验本体库

专家经验知识对检索起引导作用。当用户发出检索请求时,检索代理根据相应的用户偏好和专家经验知识本体,指导搜索过程沿着效果最优的方向进行。

(4)领域本体库

领域本体提供了学科领域的概念、概念之间的关系以及领域的核心理论,通过概念蕴涵、属性关联、相互约束和公理定义等方法,组织成具有网状结构的、可共享的形式化本体模型。非语义化的原始数据经过本体的实例化,可以实现数据的表现形式、结构和内容之间的分离,成为机器可理解的信息,从而为语义互操作、智能推理提供可靠的保障。

(5)检索代理

检索代理的主要功能是负责整个知识挖掘与检索过程。它直接检索领域本体对象库,如果检索到相关的领域知识,则向用户界面返回检索结果。如果检索失败,则向搜索代理发出查询请求。检索代理的另一个功能是在系统负载不重的时候,根据用户偏好主动搜索信息资源中的新文档,并将之加工和存储在领域本体对象库中。

(6)本体代理

它是整个模型的核心组件之一,负责参照本体库的建立、维护、查询及其与其他部件的协作管理。例如,帮助用户规范检索请求,根据领域本体帮助搜索代理查询文档并分析文档所属的领域,实现文档的自动分类,然后将文档信息以适当形式存储到领域本体对象库的相关部分。

(7)搜索代理

搜索代理的主要功能是对网络信息资源发出查询以及对返回的结果在本体代理的协作下进行处理。

2.基于语言本体的查询式优化方法

知识检索系统的用户通过输入查询式来表达其检索需求,查询式可以有三种表达形式,分别为自然语言表达、关键词表达和专门的语法形式表达。

无论是哪一种形式的查询式,最终都将产生一组概念项和逻辑关系(与、或、非)的集合,被称为用户需求概念空间。知识检索过程就是将用户需求概念空间和事实数据概念空间进行匹配的过程。但是,由于用户的使用经验不足、查询式处理方法的缺陷等原因,常常导致形成的用户需求概念空间存在各种问题,如不能真实反映用户的实际检索需求,存在不一致性和重复性、内容不够全面等,这些都将影响知识检索的质量。另外,有时用户输入的查询式过于简单,导致用户需求概念空间中的概念项数量太少,难以形成有效的检索。因此,为了充分理解和正确表示用户的检索需求,在对用户概念空间进行匹配之前,需要通过本体中的各种关系对其进行优化和扩展。

在本小节中将研究如何利用语言本体对用户查询式进行优化,在下一小节中,将进一步探讨如何利用领域本体对用户查询式进行扩展。

假设用户的原始的概念空间为{K,Q},其中K为用户查询式中的检索概念项的集合,Q为概念项间逻辑关系的集合,则利用语言本体对其进行优化的过程可以分为两步:

第一步,将K中的用户概念项映射为语言本体中的概念,形成新的概念集合C。

第二步,根据语义关系和原始的逻辑关系Q,对C执行逻辑转换规则,确定新概念间的新逻辑关系,形成新的概念空间。

对于第一步,假设K中的检索概念项为(K1,K2,…,Kn),对于其中的每一个概念项,查找语言本体中与之匹配的概念,包括其同义词和各种词形变化,每一次成功的匹配都产生一条记录(Ki,Ci)。其中,Ki是K中的某一检索概念项,Ci是语言本体中与Ki匹配的概念,由于一个Ki可能具有多个相关的Ci,因此一个Ki可能拥有多条记录。所有的Ci即构成了新的概念集合C。

当K中的所有用户概念项都被映射为语言本体中的概念后,则进行第二步,即根据集合C中各概念间的语义关系对原有的逻辑关系进行转换,形成新概念间的新的逻辑关系。概念间的语义关系包括:同义关系、上位/下位关系、半义/全义关系和反义关系。

转换过程主要通过应用一套逻辑转换规则来实现,对于C中的任意两个概念项Ci和Cj间的逻辑关系,其基本转换规则如下。

(1)如果Ci与Cj间具有逻辑“与”关系,即Ciand Cj,则:

●Ci与Cj同义→Cior Cj

●Ci为Cj的下位→Cj

●Ci为Cj的半义→Ci

(2)如果Ci与Cj间具有逻辑“或”关系,即Cior Cj,则:

●Ci与Cj同义→Cior Cj

●Ci为Cj的下位→Cj

●Ci为Cj的半义→Cj

●Ci为Cj的反义→Cior Cj

(3)如果Ci具有逻辑“非”关系,即not Ci,则:

●Ci与Cj同义→not Cj

●Ci为Cj的上位→not Cj

●Ci为Cj的全义→not Cj

●Ci为Cj的反义→Cj

如果C中的概念具有多种逻辑关系组合,则通过上面的基本映射规则的组合来实现映射。

通过基于语言本体的查询式优化过程可以保证用户查询概念在语言层次上的正确性、完整性、连贯性和一致性。

3.基于领域本体的查询式扩展方法

在知识检索的执行过程中,有时会出现检索失败的情况,产生检索失败的主要原因是无法找到任何符合查询条件的事实数据。处理检索失败问题的方法是对用户查询式进行扩展,放宽查询条件或者获取更多的语义表示,这样产生的结果可能和原始的预想并不完全一致,但是也能够足够相关。在基于本体的知识检索系统中,可以根据领域本体中的概念和关系对用户查询式进行扩展,这主要可以从两个方面来进行。

(1)利用基本的类层次结构关系

领域本体中的概念类层次结构所体现的父子关系可以作为查询式扩展的依据。利用“父类”的通用概念代替用户的检索概念,或者用抽象的属性值代替具体的属性值都可以减少对查询的限制,获得更多的结果。利用“子类”的专指概念代替用户的检索概念可以获得更深的语义内容和更多的语义表示形式,也可能产生更多的检索结果。例如,假设用户的查询概念为“数据库”,系统执行检索时发现没有一条事实数据是直接关于“数据库”的,则可以利用“数据库”的父子链接寻找间接相关的事实数据。比如“演绎数据库”和“关系数据库”是本体中“数据库”的子概念,则关于“演绎数据库”和“关系数据库”的信息可能是适合的。如果“数据库”没有任何子链接,或者其子链接也没有相关的事实数据,则还可以继续搜索“数据库”的父链接(如“软件”)。

(2)利用其他相关关系

如果领域本体包含其他属于特定领域的知识关系,则也可以将其用于面向该领域的查询式扩展。其领域概念间除了“父子”关系外,还具有“相似关系”,如“SQL Server”和“Oracle”。相似的概念可以用来替代给定的检索概念,如果在检索关于“SQL Server”的事实数据时没有获得结果,则根据两者的相似关系,可以查找关于“Oracle”的事实数据,作为检索结果。

领域本体中的领域概念通过各种知识关系交叉链接,形成了一种庞大的结点网络。根据本体这种结构特点,可以采用启发式扩展激活的方法在“网络”中对查询式进行扩展。它的基本原理是利用领域本体中的概念关系知识作为启发式知识,利用扩展激活算法,搜索和选择合适的检索概念项(参见第5章)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈