首页 百科知识 基本检索方法

基本检索方法

时间:2022-10-17 百科知识 版权反馈
【摘要】:系统设定检索时间范围为最近3年,用户也可以在1天到3年的时间范围内进行改变。如果查找汉语信息,可用英语查找,并将结果限定在汉语中。Yahoo,Altavista也提供类似的检索方法。如Altavista的NEAR运算符规定两词在文本中出现的位置必须在10个词之内。大部分系统都可进行字段规定,但是字段的数目和表示方法稍有不同。

9.3.2 基本检索方法

基本检索方法主要有两种:分类查询和关键词查询。

1.基本检索策略——布尔逻辑检索

几乎所有的检索系统都具有布尔检索功能,布尔运算符包括AND、NOT、OR。如检索式:engine AND(car OR truck)。

用“A AND B”进行查询的结果是指既包含查询词A又包含查询词B的文章。

用“A OR B”进行查询的结果是指包含A或B其中一个查询词的文章。

用“A NOT B”进行查询的结果是指包含查询词A而不包含查询词B的文章。

2.范围限定

二次检索:对于再次检索,可以重新开始,在整个索引中检索,也可限定在遣词检索结果内,优化检索。

时间范围(时间限制):Yahoo!系统设定检索时间范围为最近3年,用户也可以在1天到3年的时间范围内进行改变。

语言限制:Altavista可以查询25种不同语言的信息,其中包括英语、日语、汉语、德语等。但是查询时不能用含有双字节的字符(如汉语、日语等)进行查找。如果查找汉语信息,可用英语查找,并将结果限定在汉语中。

3.智能检索/概念检索

Excite使用“概念检索”ICE(Intelligent Concept Extraction)技术,通过发现词语概念间存在的关系,自动加入一些检索词,如输入“elderly people financial concerns”,除找出精确匹配这些词的文献外,还会找出有关“economic status of retired people”、“the financial concerns of senior citizens”等节点。这些概念关系是从文献本身中获得的,并且不断从它所索引的新文献中进行更新。Yahoo,Altavista也提供类似的检索方法。概念检索实现了受控语言的一部分功能,即同义词、广义词或狭义词。

4.相邻检索(位置检索)

对检索词在文本中的位置进行限定。如Altavista的NEAR运算符规定两词在文本中出现的位置必须在10个词之内。Web Crawler的NWEAR运算符还可指定间隔词语数目,ADJ运算符则限定两词必须按规定的顺序相邻。

5.字段限定

限定词语在文献中出现的部位,如标题、网络地址(URL)、anthor、textapplet、object、link、image、host、domain等。大部分系统都可进行字段规定,但是字段的数目和表示方法稍有不同。

6.词语检索

在一串词的前后加双引号(“”)或用连字符连接,限定检索结果中的词语必须以同样的顺序出现,且相邻。如“中国经济发展”。

7.通配符/截词检索

在一个词的右边加星号(*)可以实现部分匹配。Altavista系统规定*号前至少有3个字母,而*号可以代表0~5个字母。匹配的词语在词义上可能并不互相关联。如sing * 可代表sing,singe,single,singular,singing,singer等。只有少数系统提供该项功能。

8.注意利用多元搜索引擎

Internet上有许多著名的搜索引擎,如百度(全文搜索)、Yahoo!(主题搜索)等,它们都有着各自容量巨大且内容不断更新的数据库。但是,随着Internet信息的不断增长以及各种新的搜索引擎的不断涌现,人们希望更快速、更方便地获得信息,而多元搜索引擎的出现从一定程度上满足了这一需要。若在一个多元搜索引擎的查询界面上输入关键词并单击查询(Search)后,它会自动将这些关键词提交给多个搜索引擎进行检索,然后,将搜索结果取回并整理后供浏览。

9.其他

(1)字母大小写。有些系统区分字母大小写,如Altavista,Infoseek;有些系统不区分大小写,如Yahoo!。

(2)名词检索。有些系统对名词检索有特殊规定。Infoseek要求对人名或地名首写字母大写,如查找电影明星Rock Hudson,假如不大写首字母,则会找出rock climbing、rock music、Hudson River等资料。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈