首页 理论教育 主题检索和主题词检索的区别

主题检索和主题词检索的区别

时间:2022-02-23 理论教育 版权反馈
【摘要】:[21]这个定义中包含了“本体”概念化、形式化、明确的、可共享的、领域的这些特点。在构造一种本体之前,要明确是特定领域还是通用领域。接下来让我们具体看一个“数字参考咨询人员”的期刊论文本体实例。
语义环境下的组织方法(本体)_连续性资源组织:模式演变

(一)本体定义

本体(Ontology)又称“本体论”或“知识本体”,这个定义最早来源于古希腊哲学,在引入人工智能、信息科学等学科领域后,不同的研究者对本体做出了定义。T.Gruber于1993年提出:“本体是对共享概念进行形式化的显式的规范说明”。1998年,Studer等人在T.Gruber定义的基础上对本体的定义给出了一个更为简明的解释,即“知识本体是对概念体系的明确的、形式化的、可共享的规范说明”,并且进一步指出,知识本体是“领域领域知识规范的抽象和描述,是表达、共享、重用知识的方法。”[21]这个定义中包含了“本体”概念化、形式化、明确的、可共享的、领域的这些特点。可见,这里的“本体”已然成了实实在在的信息组织的语言工具,有人将“Ontology”译为“实用分类体系”或“本体分类语言”等也是对的其功能的诠释。

(二)本体简介(见表7-8)

表7-8 本体分类、描述语言、构建工具、构建方法及应用

(三)本体与传统知识组织模式的比较

分类法虽然能涵盖所有学科的分类、层次结构清晰,但分类不够细化;主题词表虽然能涵盖所有学科的主要术语,相对稳定,但缺乏结构性,不能经常修订,而且由于按字顺排列无法全面反映学科整体情况。本体虽然具备概念间的关系描述细致全面,可重用、共享,揭示知识间语义关系,但还是有工作量大,没有相应的标准,需要不断维护等不足之处。

(四)本体构造程序

虽然,构造本体有各种各样的方法,但综合起来,一般应按下列程序进行:

第一步:确定知识领域。在构造一种本体之前,要明确是特定领域还是通用领域。第二步:调研现有本体,对现有本体调查分析,可以提高本体的质量和建立速度。如DAML ontology library(www.daml.org/ontologies)等。第三步:选择词汇、概念。第四步:定义类名、特性和逻辑关系(见图7-8[22])。第五步:以知识模型为基础设计本体(见图7-9[23])。

图7-8 交通工具概念的本体分类和关系

图7-9 本体构造模型示例

(五)期刊论文本体组织和检索实例

基于本体的期刊论文组织和检索系统区别于传统期刊论文组织和检索的主要标志之一是语义组织和检索全面地反映用户的需求,它将信息检索从传统的基于关键词层面提高到基于知识(或概念)层面,本体是一种新型的元数据,其目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的明确定义,由此实现知识重用。假设一个领域中都建设了相应的本体,那么基于自然语言的查询请求就可以翻译成某一个领域本体中公认的概念组成的查询请求,再通过本体的影射和互操作实现对不同领域中相关主题和不同语言的相关主题的检索,这样就实现了对查询请求的语义理解、自动分发。

接下来让我们具体看一个“数字参考咨询人员”的期刊论文本体实例(见图7-10[24])。假如想知道数字参考领域相关的人员,则在检索框中输入“数字参考咨询人员”,系统将显示与数字参考领域有关的咨询馆员、虚拟团队、学科专家等相关文献列表,当然,这些检索词是实现设置好的本体词汇。

图7-10 期刊论文本体构建后的语义检索实例

当本体的期刊论文检索系统建好后,用户在该浏览环境中不仅可以发现单篇期刊论文,同时也可以发现与该篇论文构成的趋势和关系,如用户不仅可以获得单篇论文的著者、文摘等信息,也可以根据关系获得它的参考文献、相关文献等信息,有效拓展用户的思路,具体显示结果如图7-11[25]所示。

图7-11 期刊论文本体构建后的语义检索结果实例

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈