首页 百科知识 语义检索专利查询大概费用

语义检索专利查询大概费用

时间:2022-02-20 百科知识 版权反馈
【摘要】:语义搜索引擎概念模型如图6-10所示。图6-10 语义搜索引擎基本结构语义搜索引擎基本结构由四大部分组成:本体服务器模块、信息搜集与处理模块、推理机模块、信息查询模块。语义搜索引擎的另一个核心模块是推理机模块,也是它区别于传统搜索引擎的关键性模块。(二)应用语义搜索引擎优化数字图书馆服务1.语义搜索引擎优化数字图书馆信息检索服务[8]信息检索服务是数字图书馆服务中重要的组成部分。
语义索引擎_连续性资源组织

(一)语义搜索引擎技术[7]

随着信息环境的飞速发展,用户对运用搜索引擎技术检索多元化信息的期望值也不断增长,对信息获取的专业性与准确性的要求与日俱增。当前人们主要使用的是基于关键词的检索,然而,大量异构、非结构化数据的存在加大了获取有用信息的难度,特别是文档中有一词多义或多词同义的现象存在时,检索会出现歧义、误检、漏检等情况。语义搜索引擎是在理解Web页面中词语表达的语义及其相互关系的基础上进行合理的逻辑推理,使机器理解包含语义的文档和数据,进而完成复杂的查询任务,最终将精确检索结果返回给用户的一种智能搜索引擎。语义搜索引擎概念模型如图6-10所示。

图6-10 语义搜索引擎基本结构

语义搜索引擎基本结构由四大部分组成:本体服务器模块、信息搜集与处理模块、推理机模块、信息查询模块。与传统搜索引擎不同,语义搜索引擎概念模型增加了本体服务器模块和推理机模块。本体服务器是语义搜索引擎的核心模块,它从内部功能的角度共分为3层:本体访问层、本体表示层和信息集成层,分别负责本体的使用、存储和获取问题,本体库通过本体映射实现与其他已有本体库的交互,同时在推理机的支持下进行本体一致性检查等操作。本体作为一种语义描述工具,在语义搜索引擎工作过程中充当了总体底层概念集的角色,提供概念归并、关联分析等总体支撑。语义搜索引擎的另一个核心模块是推理机模块,也是它区别于传统搜索引擎的关键性模块。推理机是由一组具有推理策略的程序组成的推理系统,在此模型中,推理机是针对本体的推理,它首先接受上一层的查询语句,然后根据推理规则结合本体服务器中相关本体进行语义推理,使得无序的自然语言具备语义上的逻辑关系,形成富含语义的查询表达,再输出精确的检索语句,最后通过信息查询模块完成整个检索过程。

(二)应用语义搜索引擎优化数字图书馆服务

1.语义搜索引擎优化数字图书馆信息检索服务[8]

信息检索服务是数字图书馆服务中重要的组成部分。通用数字图书馆搜索引擎对于信息的检索是基于关键词的,多义词和同义词的存在降低了查询结果的精确性,在检索信息时通常会找到大量的与检索目标无关的内容。而语义搜索引擎对数字图书馆信息检索系统的优化体现在它是基于知识库推理的,能够根据知识的结构、推理规则和精确的概念进行检索,从而得到更为接近检索目标的检索结果。它对于数字图书馆信息检索服务的优化可以分为基于自然语言的处理方法和基于语义网技术的处理方法。

(1)基于自然语言的处理方法

这一类型的语义搜索利用语义技术来改善传统搜索的效果。其核心仍然是传统的搜索引擎,本体技术以多种途径被用来增强关键字搜索,改善搜索的查全和查准率。通过建立有效的表示词语之间关联的词语同现矩阵,构建语义表达词语之间的关联作用,使搜索引擎对用户的输入内容具有一定的语义理解能力,当用户的请求与词语同现矩阵中的个体匹配时,词语同现矩阵中关于该个体的结构化语义信息也同时返回给用户。这样可使用户在检索概念模糊或受专业领域限制等原因而导致检索词语不精确的情况下,仍能检索出相关内容。具体可应用于单一词汇查询、多词查询和长句查询。

(2)基于语义网技术的处理方法

数字图书馆用户语义搜索引擎的服务对象还包括很大一部分具有很强的专业指向性的用户,这类用户在对所检索到的信息的专深度方面也有更深层次的要求。基于语义网技术的处理方法在保证特定用户检索结果的专深度方面具有很大的优越性。

[9]语义网技术的索引原理

词语是语义表达的符号,语义的表达是通过若干词语的组合而实现的,索引方式的优劣是决定检索质量好坏的一个决定性因素,语义网技术对数字图书馆信息检索服务的优化主要是通过对索引方式的优化体现出来的。语义搜索引擎所使用的索引方式主要是通过概念空间语义索引途径实现的,概念空间是对索引对象进行自然聚类后所得的一种层次结构,其语义索引过程模型如图6-11所示

图6-11 概念空间语义索引过程

概念空间语义索引结构呈现树状,其叶结点是索引对象,根节点是概念,依次从具有共性的索引对象中提取。概念空间结构与目录式结构的区别在于,概念空间采用机器学习,自下而上自动生成,分层建立索引,有效避免了信息聚类过程中的噪音干扰,因此,在概念空间层次结构基础上建立的索引,其准确性就可以得到充分保证。

②实现模式

基于语义网技术的搜索引擎优化数字图书馆的实现模式与传统检索方式的比较如图6-12[10]所示。该实现模式主要由推理机、语义检索及标注、语义检索及语义排序3个模块组成,一方面语义搜索引擎通过本体库对数字文献资源进行标注,将原来纯粹的字符集合转化为富含语义的资源,随后针对这些语义资源建立索引,形成索引文档以备检索时使用;另一方面用户的查询表达通过本体库进行处理,形成富含语义的查询表达,在搜索引擎中实现查询处理。

在此优化模型中,对于用户提交的检索请求经过信息抽取过程后,不再只经过简单的查询处理直接到达检索模块,而是在领域本体库的支撑下由推理机模块进行语义理解、智能推理、语义索引及标注等操作,从而输出更为精确的语义检索词,再经由检索模块进行检索,并对返回的结果进行处理,这样就实现了在检索表达不一致的情况下的语义信息检索。

图6-12 语义网搜索引擎优化数字图书馆实现模式

2.语义搜索引擎优化数字图书馆个性化服务[11]

在信息社会中,数字图书馆面对的是建立在广泛性基础上的、信息需求日益多元化、个性化的用户,数字图书馆强调以用户为中心,有针对性地、为特定的信息找到特定的用户,使特定信息发挥最大效用;同时也为特定的用户找到特定的信息,满足用户特定需要。语义搜索引擎的重要特点之一是以用户为中心,这在很大程度上有助于促进数字图书馆个性化服务系统的改进与完善,其优化措施主要体现在个性化信息定制、个性化信息推送、个性化垂直信息服务3个方面,在此基础上本书构建了数字图书馆个性化服务系统优化模型,如图6-13所示。

图6-13 个性化服务系统优化模型

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈