首页 理论教育 基于概念的知识检索模型

基于概念的知识检索模型

时间:2022-03-04 理论教育 版权反馈
【摘要】:基于概念的知识检索模型,根据概念及概念之间的相关性,在语词的概念含义层次上组织用户需求和信息资源的知识内容与知识关联,通过语义推理、学习及概念的逻辑匹配,实现概念检索和启发式搜索。在基于概念的知识检索模型中,概念作为知识检索进程的主要驱动力,起着至关重要的作用。基于概念网络的知识检索模型在概念网络的基础上,模仿人类的发散性思维方式,可进行启发式动态检索操作。

5.2.1 基于概念的知识检索模型

基于概念的知识检索模型,根据概念及概念之间的相关性,在语词的概念含义层次上组织用户需求和信息资源的知识内容与知识关联,通过语义推理、学习及概念的逻辑匹配,实现概念检索和启发式搜索。

1.概念与知识检索

概念指的是将所感知的事物的本质特征与属性抽象出来,应用一定的字、词或词组等描述元素加以概括的结果。概念可以是具体的,也可以是抽象地定义一类对象的特征,通过描述元素表达出来。由于语言表达具有模糊不定性的特点,不仅多个描述元素可以表达同一个概念,而且同一描述元素在不同的语境中也可显示出不同的概念语义。概念的描述亦可随时空或学科领域等因素的改变而变化。在知识检索中,概念是最基本、最重要的知识元素。

由于知识的相关性,任何一个概念都不是孤立存在的。它总是与其他概念之间存在着各种各样的关联。如果能在概念层次上解析用户需求与信息源,则可以在一定程度上弥补传统字符匹配的缺陷,解决信息检索中的“词汇孤岛”问题。

在基于概念的知识检索模型中,概念作为知识检索进程的主要驱动力,起着至关重要的作用。模型依靠先进的智能用户接口、机器学习、语义分析、演绎推理、知识库等技术的支持,对信息内容进行解析,提取相关概念,并利用概念间的层次和关联关系进行学习、推理、扩展、检索以及约束控制等多种操作,最终向用户提交最佳结果,从而完成对信息资源的知识检索。

2.基于概念网络的知识检索模型

概念网络也可以称为概念空间,是以神经网络为理论依据,将概念按照各种关系连接成一个网状结构。基于概念网络的知识检索模型在概念网络的基础上,模仿人类的发散性思维方式,可进行启发式动态检索操作。

(1)概念网络的理论基础——人工神经网络与语义网络

人工神经网络(Artificial Neural Network,ANN)利用神经元模型模拟人脑结构和神经系统。由于神经元的特性与功能均比较单一,因此可以用统一的数理模型加以描述,用动力学系统的原理进行处理。神经网络能通过联想式记忆,按内容寻址,进行检索。

语义网络是基于网络结构的一种主要的知识表示方法。语义网络强大的表达能力和灵活性,使之能通过多种机制来表达概念、规则及其之间的关联知识。语义网络作为一个带有标识的有向图,其结点表示各种事物、概念、属性和知识实体等,链则表示所连接结点间的各种语义关联和动态操作关系。如今语义网络也逐渐向具有时变功能的表示执行机制的动态结构发展,具有很强的学习和自适应能力,使得语义网络能通过自身的持续执行,不断学习,改进性能。

(2)概念网络基本构架

概念网络所呈现出的是一种多维认知结构,其中通过利用启发式知识和传递激活技术,形成一种认知式的语义推理模式,实现知识库的立体联想搜索。

该模型利用学习规则和相关反馈技术,来修改、完善提问和知识库,不断改进检索结果。它适合于专业概念知识库的检索,用于扩充和优化用户需求,还可以帮助用户区别词的多义。用户可以充分描述概念和概念之间的关系,查找精确的文献内容和执行语义链的导航搜索。

概念网络也可以看成一个巨大的知识库,其知识可以包括以下几个层面:

①语言层面:反映语言表面现象的知识,如一个词的多语种(中、英)形式,它的同义词、反义词,一些习惯用语,词的层次关系等。

②本体论层面:对概念的本体论的定义与解释、概念之间复杂的语义关系。

③常识层面:如西服与领带、相机与胶卷等存在着常识上的关联。

④概念网络中的每个结点均反映唯一的知识概念内容,采用具有若干属性的元组来表示。首先依据概念知识的类属性原则,将某种或某些有相同属性的概念结点聚类,形成各种概念类。每一概念类都具有层次分明的概念树状关系,形成概念网络中的主关联(构架图中以实线表示)。每个概念子结点均可以根据实际情况拥有一个或多个父结点,这些父结点可以是同概念类,也可以是不同概念类。因此在保证概念类目唯一性的基础上,可以清晰地表达由于概念的多重从属关系而存在的概念交替关系,从而在一定程度上解决概念分类中“集中与分散”的矛盾。父结点与子结点之间表达的是概念间在内涵与外延上的纵向层次关系,即从属关系(包括属种关系、整体与部分关系、全面与方面关系等)。

通过概念分类形成了一定的概念层次划分。概念类不同但概念层次相同的概念结点可以根据自身属性或内容相互连接成关联网络,从而有效地揭示概念结点间的各种相关关系,构成概念网络中的辅关联(图5-1的构架图中以虚线表示)。概念结点间的这种横向关联使每个概念在归于一个唯一的类体系的同时,又不会被分类体系的整体性所局限。在知识检索过程中,这种网络关系使概念结点的扩展激活更加灵活机动。

(3)基于概念的知识检索

基于概念的知识检索是通过概念匹配、语义结构匹配、概念扩展、语义推理、启发式搜索等方法来实现的。常用的检索方法有:

①概念检索,以概念元素为基础,执行概念的逻辑匹配,实现知识内容的检索;

②概念网络检索,以概念之间的语义关联为基础,执行概念、关联的及其结构的逻辑匹配,实现一组相关对象的知识内容及其语

img25

图5-1 概念网络基本构架图

义结构的检索;

③启发式动态搜索,利用专家的经验知识和扩展激发原理,搜索和匹配相关的概念或对象。

在扩展激活的知识搜索过程中,由于概念之间存在频繁的两两相关,很可能导致同一个概念被多次激活的现象。一个概念被激活的频率越高,说明其内容相关度越高。对概念激活频率的记录、排序有助于对最终检索结果进行合理有效的加工。

每一个概念结点在知识检索系统的数据库、数据仓库、知识库中都拥有一定的数据映射。最后,依据映射规则获得一个检索结果集,将经过智能处理的检索结果提交给用户,并通过交互式反馈,直到用户满意为止(图5-2)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈