首页 理论教育 搜索中文文献哪个搜索引擎更快捷

搜索中文文献哪个搜索引擎更快捷

时间:2022-03-10 理论教育 版权反馈
【摘要】:对所要搜索的关键词加上[],表示括号内的词在文本中出现时,其间隔不超过100个词。所以,使用A ltaVista时,要花更多的时间在搜索结果里寻找自己想要的信息。根据检索的对象,A ltaVista搜索引擎提供三大类信息检索:Web检索和新闻组检索、商业检索以及人物检索。如果需要快速找到一些相关性比较大的信息,可以使用目录式搜索引擎的查找功能。如果要找的信息比较冷门,应该用比较大的全文搜索引擎查找。

第五节 信息检索技术

一、常用索引擎介绍

1.百度(www.baidu.com)杰出的中文搜索引擎

2.Yahoo!(http://www.yahoo.com)

它是目前最常用的引擎之一,是Internet引擎的“元老”。Yahoo!的使用很简单,可以直接输入查找关键字,也可以先选分类主题进行分类查询,它将返回三种信息:

①满足查询条件的Yahoo目录(用户可以利用它们进行交叉引用);

②满足条件的实际站点;

③更广泛的含有页面索引的Yahoo!目录,是一种更广泛的交叉引用。

Yahoo!也提供了一些简单的高级查询,其配置选项有:①S搜索的范围:Yahoo(缺省)、Usenet或E-mail Address;②S搜索词之间的关系:OR或AND(缺省);③S可以进行子串搜索,将其设置Substrings或Complete words两种,其中Substrings将我们输入的词作为一个子串,Complete words表示进行完整的单词搜索,缺省是子串搜索・控制每页显示的结果数目:10、25(缺省)、50或100。Yahoo!在高级查询上并不是很完善,但是Yahoo!在其主页的末尾提供了其他引擎如A ltaVista的超链接,如果用户在Yahoo!查不到所需资料,Yahoo!可以到这些地方去搜索。从而弥补了Yahoo!的一些缺陷。

3.InfoSeek(http://guide.infoseek.com)

InfoSeek是一个高效的搜索引擎,它的特点是:搜索精度高,查到的节点一般都与用户的要求相符。其搜索结果按照相关程度依次显示。每一个结果显示该H TM L文件的标题、摘要、大小。InfoSeek引擎拥有最好的搜索参数的集成,它允许用户在填写查寻要求时可以随心所欲地不厌其详,而它在后台则施以适当的逻辑组合。这就意味着,用户可以忽略如何使用搜索引擎,只要集中精力把自己想提的问题写好就行了。

InfoSeek数据库中每一网页的所有文本都被检索,它的搜索具有事件敏感(casesensitive),即对某些名字进行搜索时,搜索的效率会明显提高。用户输入一个短语后,InfoSeek会使用与短语最接近的排位方法,提高搜索结果的相关性。

InfoSeek可以提供以下的搜索范围:

①SWeb:在整个WWW信息系统内查找;

②SNew s:在实时新闻中查找;

③SCompany:在公司名目中搜索;

④SNewsgroups:在新闻组中搜索。

InfoSeek的搜索方法包括:

(1)词组(短语)搜索。这时需对词组加上双引号,以示与单个词的区别;

(2)查找同时出现的词。对所要搜索的关键词加上[],表示括号内的词在文本中出现时,其间隔不超过100个词。

4.A ltaVista(altavista.digital.com)

A ltaVista自1996年12月开始服务以来,引起了世界各地网民的广泛注意,每天都要接受200万次以上的访问。A ltaVista自诩拥有2100多万全文索引的网页,可以称得上是最大的网络搜索数据库。相对其他搜索引擎而言,A ltaVista的搜索结果总是比其他任何站点的搜索结果内容更丰富,A ltaVista的搜索范围大得惊人。有人说能对网络的天涯海角进行彻底搜索的仅此一家,就连一些鲜为人知的偏僻站点也能找到。所以,使用A ltaVista时,要花更多的时间在搜索结果里寻找自己想要的信息。不过,如果你的目的就是想找到关于某个主题的站点,多多益善,那么A ltaVista是最好的选择。根据检索的对象,A ltaVista搜索引擎提供三大类信息检索:Web检索和新闻组检索、商业检索以及人物检索。除公共检索服务外,A ltaVista还提供免费E-mail、页面翻译等相关服务。它的搜索方法分为简单和高级两种。

(1)简单搜索

A ltaVista搜索引擎推荐使用的检索方法,是直接使用自然语言输入检索提问。检索提问可以是自然语言的单词、词组或短语以及完整的问题。对使用A ltaVista的最有用的建议是,由于它的索引是基于整个单词的正文的,在描述查找的单词时越精确越好,还要去掉那些不感兴趣的单词。

(2)高级搜索

高级搜索包含了简单搜索的所有特性,还可以有布尔和接近操作符、括起来的逻辑组合等。A ltaVista支持二元操作符AND、OR、NEAR和一元操作符NOT。

A ltaVista的接近操作符(NEAR)很有特色。可以使用NEAR/n,n是两个被搜索词之间的单词的数目,如:M icrosoft NEAR/5 Internet表示在“M icrosoft”和“Internet”这两个关键字之间的单词数目不得超过5个。如果不输入n,表示两个词挨在一起。为了控制挨在一起的两个词之间的顺序,可以使用ADJ操作符,如:M icrosoft ADJ Internet,表示M icrosoft必须在Internet之前。

5.Google(www.google.com)

Google是在国外很受欢迎的搜索引擎,界面简洁,以搜索结果的准确性著称,它的网页快照和图片搜索也很有特色。

网页快照就是网页的备份,你在Google搜索的时候,如果发现某条搜索结果点不进去,是死链接,那么只要点击搜索结果旁边的网页快照(Cached),就能看到Google保存的备份网页。

Google还有世界上最大的图片搜索引擎(images.google.com),收集了互联网上3.3亿张图片,如果你想找哪个偶像的照片、想找某个名胜的风景照、想找军事兵器图片,只要输入合适的英文单词,很容易找到满意的图片。

二、信息搜索技巧

1.使用逻辑词辅助查找

比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND(和)、OR(或)、NOT(否)及NEAR(两个单词的靠近程度),恰当应用它们可以使搜索结果非常精确。另外,也可以使用括号将搜索词分别组合,如〔(新闻OR足球)AND米兰)NOT(“新闻”OR足球〕。

2.使用双引号进行精确查找

如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。

3.有针对性地选择搜索引擎

用不同的搜索引擎进行查询得到的结果常常有很大的差异,这是因为它们的设计目的和发展走向存在着许多不同,有的专用于USENET的搜索引擎,而有的则是针对邮递列表或IRC等的搜索引擎。使用时要根据自己的需要选择合适的搜索引擎。

4.使用加减号限定查找

很多搜索引擎都支持在搜索词前冠以加号“+”,限定搜索结果中必须包含的词汇,用减号“—”限定搜索结果不能包含的词汇。

5.细化查询

许多搜索引擎都提供了对搜索结果进行细化与再查询的功能,如有的搜索引擎在结果中有“查询类似网页”的按钮,还有一些则可以对得到的结果进行新一轮的查询。

6.根据要求选择查询方法

如果需要快速找到一些相关性比较大的信息,可以使用目录式搜索引擎的查找功能。如果想得到某一方面比较系统的资源信息,可以使用目录一级一级地进行查找。如果要找的信息比较冷门,应该用比较大的全文搜索引擎查找。

7.注意细节

在Internet上进行查询时,如果能注意一些细节问题,常常能增加搜索结果的准确性,如许多搜索引擎都区分字母的大小写,因此,如果您正在搜索人名或地名等关键词,应该正确使用它们的大小写字母形式。

利用选项界定查询

目前越来越多的搜索引擎开始提供更多的查询选项,利用这些选项人们可以轻松地构造比较复杂的搜索模式,进行更为精确地查询,并且能更好地控制查询结果的显示。

(1)快速搜索技巧

网上的信息搜索技术越来越多,怎样才能高效迅速地找到问题的答案呢?有几种技术可以帮助你更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧妙地结合起来使用会大大加快网页搜索进程。

(1)搜索词组

如果只给出一个单词进行搜索,经常会出现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND(与逻辑)结合起来,或者在每个词前面加上加号“+”,这种逻辑技术大大地缩小了搜索结果的范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样的语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页才是要搜索的网页。把这几种符号结合起来使用,能大大提高搜索效率。

(2)选择词组

一般说来,在网页搜索引擎中,用词组搜索来缩小范围从而找到搜索结果是最好的办法。但是,运用词组搜索涉及如何使用一个词组来表达某一具体问题。有时简单地输入一个问题作为词组就能奏效,然而简单明了地提问方法只对一部分搜索奏效。选择合适的词组对提高搜索效率是很重要的,实在找不出时可以试试下面的方法。

(3)查找信息源

有时词组搜索太精确或者一个词组无法准确表达所需信息,那么可以直接到信息源,这种技术“简单得似乎不值一提”,但却很有效。根本不用搜索引擎,直接到提供某种信息组织的站点去。很多时候我们可以用公式“www.公司名.com”去猜测某一组织的特点,从而得到所要搜索的信息的主要词组。

三、科技文献检索

科技文献检索简单地说就是利用检索工具(如网络数据库)通过一定的手段和途径获取所需要的科技文献。

对于一个科研工作者来说,文献检索的意义主要在于:(1)是继承前人经验,加快科研步伐的需要。大家会注意到,我们阅读的科技文献、学习的教材内容,往往是几年、几十年、上百年前的发现或研究成果,而这些成果对我们现在的研究往往有着不可忽视的作用,否则文献检索这门课便没有开设的必要。文献检索这门课可以帮助我们继承前人的经验,避免科研工作的重复劳动,节省科研经费和工程投资,使自己的成果始终建立在最新成果的基础上。(2)进行科研创造的需要。就科学研究的全过程来说,无论是新课题还是老课题,在课题的确定、规划的制订、方案的取舍、难点的攻关,还是成果的鉴定和总结,也都离不开文献检索。它是形成合理知识结构的一种重要手段。

【科技文献检索工具】

(1)检索工具概述。检索工具是用来报道、存储和查找文献线索的工具。它是在一次文献的基础上,经过加工整理、编辑而成的二次文献。

(2)检索工具的基本结构。一部完整的检索工具通常由:使用说明、著录正文、索引和附录几部分组成。正文由文摘、题录或目录组成。索引分主题索引、作者索引、分类号索引、期索引、卷索引、累积索引等。

(3)检索工具的类型。索引是检索工具中最重要的部分,没有索引的目录、题录和文摘,只能起到报道作用,不起检索作用,不能称为检索工具。但通常把目录、题录、文摘和索引通称为检索工具。检索工具按著录方式可分为:目录、题录、文摘和索引。

①目录(bibliography、catalogue)。目录是对图书、期刊或其他单独出版物特征的揭示和报道。它是历史上出现最早的一种检索工具类型。目录以单位出版物为著录对象,一般只记录外部特征,如题名、著者、出版事项、载体形态等。目录主要用于检索出版物的名称、著者及其出版、收藏单位。常用的目录有国家书目、馆藏目录、专题目录、联合目录、出版发行目录、期刊年终目录(一般期刊的年终最后一期上有全年的目录)等。

②题录(title)。工业生产中的需要和科研中的进展,你都可以通过文献查阅,在进行研究前了解。如果不进行文献查阅,而自以为自己的想法很新颖,便矢志不移地进行研究,是不可取的,也许人家早就进行了研究,申请了专利和发表了文章。题录是对单篇文献外表特征的揭示和报道,著录项目一般有篇名、著者、文献来源、文种等。由于著录项目比较简单,因此收录范围广,报道速度快,是用来查找最新文献的重要工具。但它揭示文献内容很浅,只能作为临时过渡性检索工具。文摘一出版,它的作用就被文摘所代替。著名的题录刊物有美国的《化学题录》(Chem ical Titles)、《现期期刊目次报道》(Current Contents)、英国的《当代工艺索引》(Current Technology Index)等。我国的《全国报刊索引》也属这种类型。

③文摘(Abstract)。文摘是系统报道、累计和检索文献的主要工具,是二次文献的核心。文摘以单篇文献为报道单位,不仅著录一次文献的外表特征(即文献的标头部分),还著录文献的内容摘要。不看原文,往往便可决定文献资料的取舍,从而节约查阅原始文献资料的时间。按文摘报道的详简程度,文摘可分为指示性文摘和报道性文摘两种类型。报道性文摘有时可代替原文,这类文摘对于不懂原文文种及难以获得原文的科技人员尤为重要。文摘类检索工具主要由文摘和索引两部分组成,分别起报道和检索作用。索引配备的完善与否是衡量文摘类检索工具的重要标志。

④索引(index)。索引是揭示各种文献外部特征或内容特征的系统化记载工具。它的著录项目没有目录、题录、文摘那样完全,大多数索引不能直接查到原始文献资料,而必须通过该文献资料在检索工具中的序号,在检索工具的正文中找到文献资料的来源出处,进而找到原始文献资料。学习检索工具的使用方法,主要是学习索引的使用方法。

【科技文献检索的途径】

(1)根据文献的外部特征进行检索

①文献名途径。文献名主要指书名、期刊名、论文名等,文献名索引都按名称的字序或笔画排列。如检索石油化学类书籍时,查五划“石”字即可;脱蜡,Wax Removal。

②作者途径。这是根据已知作者的姓名来查找文献的途径。常用Author Index进行检索。由于一个人在一生中从事的职业和研究的课题是相对固定的,因此,通过跟踪某一作者可以检索某一专题的主要文献。但这种检索方法所查的文献不系统、不完整。如作者王老五发表的论文,可以在Author Index中查Wang L.W。但你必须经常翻阅相关领域的科技文献,否则你不知道谁从事该领域的研究。

③序号途径。这是根据文献的编号来查找文献的途径。这种检索工具有报告号索引、标准号索引、专利号索引等。利用该途径进行检索时,必须首先知道所查文献的号码,因而这类索引的利用受到限制。例如要了解某一专利的详细内容时,就必须首先知道它的专利号。如图书分类号:O64———物理化学,TP———自动化、计算机;有时按分类号查快;有时按笔画查快,如:高等有机,高等数学,高等教育,高等代数等。因为高等太多,如果查高等数学,按O13查较快。又如TP类包含了计算机、自动化等,类别很多,如果查计算机最好按笔画查。

④其他途径。另外也可以根据文献是纸张出版物还是电子出版物、是英文还是中文、出版日期等外部特征进行检索。

(2)根据文献的内容特征进行检索

①主题途径。这是按照文献的主题内容进行检索的一种途径。这类检索工具有主题索引、关键词索引、叙词索引等。该途径以文字作标识,索引按照主题词或关键词的字顺排列,能把同一主题内容的文献集中在一起。如CA的Subject Index和Keywords Index。看起来有点像文献名检索途径,但主题途径是按文献的内容进行分类的。

学科分类途径。这类检索工具有分类目录、分类索引等。用此途径进行检索,能把同一学科的文献集中在一起查出来,但新兴学科、边缘学科在分类时往往难于处理,查找不便。另外从分类途径检索必须了解学科分类体系,在将概念变换为分类号的过程中常易发生差错,容易漏检或误检。在检索专利文献时所用的IPC(International Patent Classification)分类号途径,即属于学科分类途径。其他途径根据学科的不同性质和不同特点,不同学科的文献检索工具有自己独特的检索途径。如CA的环系索引、分子式索引等。

③倒查法:由近及远,按时间逆序查找,重点放在近期新文献。此法省时灵活,效率较高,但会产生漏检而影响查全率

④抽查法:对课题研究进展最快、发表文献最多的若干年的文献,逐年查找。这几种方法各有适用的条件,各有优缺点。

⑤追溯法:利用最新发表的文献后所附的参考文献,由远及近,追溯查找相关文献。形成类似连锁反应的检索网络。此法检索不需要利用检索工具,查找方法简单。但检索效率不高,漏检率较大。这种方法是不少科技人员常用的方法,方便实用。如有这样一篇论文:Title:Visbreaking of Vacuum Residue in the Presence of AdditivesAuthor:M ichel Thomas Reference:Schuetze,B.and Hofmann,H.,Hydrocarbon Processing,1984,75追溯法就是利用上面的作者M ichel Thomas,Schuetze,B.and Hofmann,H继续查作者索引,或查Hydro-carbon Processing,1984,75,并且可以继续查Hydrocarbon Processing,1984,75后的参考文献和作者。

⑥循环法:综合利用常规法和追溯法进行检索。首先利用检索工具查找出所需文献,再利用文献后所附参考文献,追溯查找相关文献。如此交替使用常规法和追溯法,直到取得满意的效果。例如:先在CA上查最近一年的“关于FCC汽油加氢脱硫催化剂进展”方面的相关文献(顺查法),再根据每篇文献后的参考文献追溯其他文献(追溯法);然后再去查前一年的CA(倒查法)。检索步骤如下:a.分析课题———明确检索范围及要求;b.选择检索系统———确定检索标识;c.确定检索途径和检索方法;d.查找文献线索;e.查找和获取原始文献。

(邹菊梅 沈永江)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈