首页 百科知识 其他语义搜索引擎介绍

其他语义搜索引擎介绍

时间:2022-10-01 百科知识 版权反馈
【摘要】:SenseBot是一款将搜索结果提炼总结为一个精练的文摘形式的语义搜索引擎。Powerset是一个对于研究目的的搜索而构建信息和表述的语义搜索引擎。目前它还不是一个正规的网页互联网搜索引擎。Deepdyve是目前拥有呈现这些有价值的信息来源的较简易界面的服务搜索引擎。Cognition的搜索业务是基于语义地图,在它成立的24年后,Cognition得以自称是如今可用的最全最精的英语搜索地图。

下面介绍的这些索引擎都多少采用了语义分析来筛选和诠释数据。但是,这几个搜索引擎采用了不同的方式并且展示了各自不同的产品。

9.5.1 SenseBot

SenseBot是一款将搜索结果提炼总结为一个精练的文摘形式的语义搜索引擎。它试图去理解这些搜索结果的界面的意义。从这个出发点来看,它使用的是文本挖掘,试图分析网页并鉴定他们关键的语义概念。

SenseBot从这个方式帮助用户迅速地掌握哪些相关的信息到底是什么。从这个角度来看用户不需要自己去寻找大量的网页,甚至梳理出现的结果中不完整的专家的定义(甚至不需要理会任何定义)。

这个精练总结的作用是帮助消化用户搜索的主题,将各种搜索结果的相关、重要内容汇聚在一起。它还提供给用户由各种相关概念以及一个被认为是定义总结了的搜索问题的语句的表单汇聚成的标签云。每个语句后面还包括了它们的出处的链接。

也不是所有的总结都是信息广泛或者容易理解的,但却是极有可能被改进的。目前SenseBot还在测试阶段。

9.5.2 Powerset

Powerset是一个对于研究目的的搜索而构建信息和表述的语义搜索引擎。目前它还不是一个正规的网页互联网搜索引擎。它相对小型,语料库相对有限。该技术提供了相对全面的信息资料。用户可以在维基百科上进行测试,但是会发现Powerset更擅长这方面的搜索,可以说Powerset是基于维基百科的一个巨大改善。

用户可以在搜索栏输入关键词、短语、或者一个简单的问题。Powerset通常会直接在搜索结果的界面上直接回答问题。其中最突出一个特色就是Powerset把多个文章中的信息综合在一起。例如,当用户搜索奥巴马,Powerset提供了一些奥巴马对罗伯特盖茨、中东、巴基斯坦、贸易的看法的信息的链接。点击搜索结果中一个链接,将显示出一个小的对话框,里面会有奥巴马在提到文章中发言的引用,还有被引用话语的原文链接。

9.5.3 DeepDyve

DeepDyve是一个非常强大专业的语义搜索研究工具,它提供给大众免费的服务。(DeepDyve的搜索服务是免费的,但是如果用户要阅读搜索出来的学术期刊,还是要付费的。)这是一个研究引擎帮助用户进入专业内容的“深层网络”:那是互联网中没有被传统的搜索引擎索引或收录的信息(比如一些专业数据库,期刊等)。学者,研究员,学生,技术专家,商业等DeepDyve的用户和其他信息消费者可以在以下分类中搜索维基百科和“深层网络”的信息:生命科学,医学,物理科学,人文和社会科学,商业和金融,专利、法律、清洁能源科技、电子工程。

研究网站的搜索引擎往往依赖于布尔语言或硬编码的分类(逻辑运算计算机语言),这些语言是有门槛和一定的学习曲线,一般人从业者是很难使用它们的。Deepdyve是目前拥有呈现这些有价值的信息来源的较简易界面的服务搜索引擎。

用户的搜索问题可以是任何独立单词甚至多个字的问题构成的。这个搜索的结果会以一种复杂的方式呈现,包括了许多高级的选项:提炼,分离,存储你的搜索。即使有复杂型的存在,这个搜索结果还是相对来说很容易浏览的。

9.5.4 Cognition

Cognition的搜索业务是基于语义地图,在它成立的24年后,Cognition得以自称是如今可用的最全最精的英语搜索地图。

用户可以使用Cognition的技术来搜索下面四个载体内的信息。

(1)Public.Resource.org(目前一共有675 704个联邦案例法文件,1 858卷,全部都是XHTML格式的文件)。这次发布的信息由自1950年开始高等法院和上诉法院的决定组成。

(2)MEDLINE(医疗文献分析及在线检索系统)摘要库:此数据库内的摘要来自于世界文献数据库内的生命科学生物医药科学信息。它囊括了医药、护理、医药学、牙医学、兽医学和健康关怀的信息,还有一些和医学没有直接联系的领域的信息,例如分子进化论(目前有18 005 903个文件)。

(3)全部英文版本的维基百科内容。

(4)最全面的新英语翻译内容,包涵文本和诸如福音书theGospels of Matthew,Luke,John and Mark的译者笔记。

通过在维基百科内测试Cognition发现,在这个拥有大量文本的资料库中,Cognition在对复杂问题的意思分类上表现的尤为出色。

(1)词汇:比如区别“古老的礼拜堂和古老的庙宇”。

(2)意思区分:“罢工的工人”对比“加州的石油黄金”。

(3)分类:例如“拉丁美洲的印第安部落”或是“北美洲树木疾病”。这些Cognition使用的去解决搜索问题的技术是给人以深刻的印象,Cognition给使用者提供了一种友好的方式去更有价值地控制意义和分类。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈