首页 理论教育 途径及策略

途径及策略

时间:2022-03-04 理论教育 版权反馈
【摘要】:根据检索要求的不同,工具法又分为顺查法、逆查法和抽查法。另外,从分类途径检索必须了解学科分类体系,将概念变换为分类号的过程时常易发生差错,造成漏检。弄清信息需求,明确检索目的。这种需求是人们索取情报信息的出发点,也是联机信息检索时选择数据库、确定检索策略以及评价检索效果的依据。数据库选定之后,其提供的检索途径也随之确定,并可根据已知的条件来确定某一个或几个检索途径。

2.4 文献信息检索的方法、途径及策略

2.4.1 文献信息检索的方法

信息检索是根据特定的课题要求,从检索系统中按照一定的方法和步骤把符合需要的信息文献挑选出来的过程。检索方法是指我们为准确、快速、有效、省时地检索出所需文献,依据一定的方法而制定的相关检索策略。常用的方法有以下几种:

(1)追溯法。又称扩展法、追踪法。是一种传统的文献检索方法,即利用参考文献进行深入查找相关文献的方法。追溯法包括两种方法,一是根据原始文献所附的参考文献进行追溯,另一种是利用引文索引检索工具进行追溯。

利用文献后所附的参考文献进行逐一追查被引用文献,然后再从被引用文献所附的参考文献目录逐一扩大检索范围,依据文献引用与被引用之间的关系获得内容相关的文献,这是一种扩大信息来源的最简捷的方法。通过追溯法获得的文献,有助于对论文的主题背景和理论依据等有更深的理解,在检索工具短缺的情况下,采用此方法可获取一定数量的相关文献。但是由于原文作者记录参考文献存在着不全面与不准确的情况,所以有时很难达到理想的结果。

(2)工具法。又称常规法。它是以主题、分类、著者等检索点,通过检索工具获得文献信息的一种方法,是一种常用的科学检索方法。根据检索要求的不同,工具法又分为顺查法、逆查法和抽查法。

1)顺查法。依照时间顺序,按照检索课题所涉及的起始年代由远及近、从过去到现在逐年、逐卷地查找信息的一种方法。此方法多用于检索内容复杂、时间较长、范围较广的理论性或学术性课题。优点是查全率、查准率较高,漏查率低,但这种方法费时费力,检索工作量大,效率低。

2)逆查法。与顺查法相反,按照检索课题的时间范围,利用一定的检索工具由近到远、从现在到过去回溯查找文献信息的一种方法。这种方法多用于检索新课题或有新内容的老课题,及对某课题研究已有一定的基础,需要了解其最新研究动态的检索课题。优点是省时省力,灵活性大,效率高,且检出的都是最新文献,新颖性高,可对某学科或研究课题的最新动态及发展水平一目了然;但容易产生漏查,查全率、查准率低。

3)抽查法。它是针对某学科发展特点和发展阶段,抓住该学科发展较快、文献信息发表较多的年代,抽出这段时间进行检索的一种方法。它是根据学科发展的脉动性特点而采用的一种有效的检索方式。优点是能获得一批具有代表性、反映学科发展水平的文献,检索效果和效率较高,但使用这种方法必须了解和熟悉学科发展的特点及历史背景,方可得到满意的检索结果。

(3)循环法。又称交替法、综合法。它是指分期、分段交替使用追溯法和逆查法这两种检索方法以达到优势互补,获得理想结果的一种检索方法。具体步骤是:先利用检索工具查得一批相关文献,然后再利用这批文献所附的参考资料进行追溯查找,从而得到更多的相关文献,如此交替使用,直至满足检索需求为止。这种方法具有两种检索方法的优势,但前提是原始文献必须收藏丰富,否则会造成漏查。

2.4.2 文献信息检索的途径

查找文献,可根据文献的不同特征从不同的角度来进行,因此,文献检索有多种途径。

2.4.2.1 按内容特征检索

(1)主题途径:主题途径是按文献内容的主题来查找文献的途径。以确定的主题词作为检索入口,按主题字顺进行查找。一般利用主题目录和文献检索工具中的主题索引。主题词选词的参照体系是《主题词表》。用主题途径检索文献的优点是不用考虑文献的学科体系,比较直观,适合特性检索。

(2)分类途径:分类途径是按照文献所属的学科类别来检索文献的途径。以分类号(或类目)作为检索入口,按照分类号(或类目)的顺序进行查找。一般利用分类目录和文献检索工具中的分类目次表,依据的是一个可参照的分类体系。比如分类法、分类目次等。用分类途径检索的优点是能把同一学科的文献集中在一起查出来,缺点是新兴学科、交叉学科、边缘学科在分类时往往难以处理,查找不便。另外,从分类途径检索必须了解学科分类体系,将概念变换为分类号的过程时常易发生差错,造成漏检。

2.4.2.2 按外表特征检索

(1)著者途径:根据著者的名称查找文献,以已知著者(个人著者、团体著者或公司、机构)的名称作为检索入口,通过著者目录、个人著者、团体著者索引来查找所需文献的途径。

(2)题名途径:根据篇名或书刊名称进行检索,根据文献题名(包括书名、刊名、篇名)来查找文献的途径。它以题名作为检索入口,检索者只要知道文献的题名,就可以通过文献的题名索引(目录)查找到所需文献。

(3)序号途径:根据文献的顺序编号进行检索,以文献出版时所编的序号(专利号、标准号、报告号、合同号、文献登记号或入藏号等)作为检索入口,利用序号索引来查找文献的途径。序号索引排列时,分两种情况:序号单纯为数字的,按数字大小排列;序号为字母与数字混合,即数字前冠有字母的,先依字母顺序、后按数字大小排列。若已知文献号码,使用这种检索途径,不仅简单,且不易造成错检或漏检。

(4)引文途径:通过文献结尾所附参考引用文献或引文检索工具查找引用文献。

2.4.3 文献信息检索的策略

2.4.3.1 检索步骤

(1)弄清信息需求,明确检索目的。信息需求是人们客观上或主观上对各种情报信息的一种需求。这种需求是人们索取情报信息的出发点,也是联机信息检索时选择数据库、确定检索策略以及评价检索效果的依据。不同类型的课题,其信息需求的范围和程度也不尽相同。例如,申请发明、申报成果奖励、鉴定及立项类的查新课题,往往需要全面地收集某一主题范围的文献信息,这类课题具有普查、追溯的特点,应着眼于查全;而对于科研、生产中为解决某一特定问题的攻关课题,往往只要求检出的信息对自己的研究有所帮助,而查找的文献范围不需要很广。因此,这类课题则要求查准。

如何对信息需求进行正确的分析呢?应从信息需求的形式和内容两方面来分析。

1)有关信息的形式需求要明确的问题有:

①明确检索目的。明确检索是为了申报成果,还是为了了解学科的最新进展等,据此制定出符合查全或查准要求的检索策略。

②明确所需的文献量。规定所需文献数量的上限,对以后确定检索策略和控制检索费用是一个很重要的参数;同时还需对检索课题可能有的相关文献量做出估计。

③明确所需文献的语种、年代范围、类型、作者或其他外表特征,这对限定检索范围也很重要。

2)关于信息的内容需求要明确的主要问题有:

①明确检索课题内容涉及的主要学科范围,这对以后选择合适的数据库很重要。

②分析检索课题的主要内容,用自然语言来表达这些内容要求,这是联机检索中较为重要的环节。

(2)选择数据库,确定检索途径。分析了信息需求后,可根据已知的条件来选择合适的数据库,这一步隐含了检索系统的选择。

选择数据库时,首先应了解:

①数据库收录的信息所涉及的学科领域;

②收录的文献类型,最好能进一步了解文献的主要来源;

③收录的时间范围;

④数据库的基本索引及辅助索引,它们提供的检索途径及检索标识的特点;

⑤数据库的检索费用,包括机时费和每篇记录的打印费。

数据库选定之后,其提供的检索途径也随之确定,并可根据已知的条件来确定某一个或几个检索途径。由于计算机存贮容量大和运算速度快,又对比较多的字段建立了索引,它不仅可以从手检中常用的主题词、分类号及作者等途径检索,而且可以从篇名、文摘的自由词、文献类型、期刊名称等途径进行检索,并且还能利用各种途径的组配进行交叉检索,这些都是手工检索所不及的。

(3)确定课题的概念组面和检索标识。弄清信息需求,了解了检索课题的主要内容后,确定其概念组面和检索标识是重要的一步。当检索课题包含较复杂的主题内容时,应明确组成课题内容的几个概念组面,并通过一定的逻辑组配形成一定的复合概念或概念关系来表达用户的信息需求。

确定了课题的概念组面,还须将概念组面转换成相应的为系统所识别的检索标识,检索标识的表示应符合两方面的要求:一是切题性,即检索标识反映信息需求;二是匹配性,即检索标识和检索系统的存贮特征标识相一致。

检索标识一般有如下三种形式:

①规范词:从待检数据库的叙词表或主题词表中选取规范化的词或词组,因为词表是数据库标引和检索必须共同遵循使用的检索语言。为了使检索提问标识与文献特征标识相一致,获得最佳的检索效果,应优先选用规范词。

②规范化的代码:索引代码是数据库系统为某些主题范畴或主题概念规定的索引单元。这类单元有很好的专指性,是一种有较好检索效果的文献特征标识。

③自由词:使用自由词检索能够充分利用系统的全文查找功能。规范词或代码的选择需利用词表或分类表等进行自然语言到规范语言的转换,而标引人员和检索人员的思路不一致时也会影响检索效果。此时,用自由词在篇名、文摘甚至全文中查找显露出一定优越性,自由词直接、简明,因此是科技人员易为接受、较为常用的一种方法。

(4)拟定检索提问式,确定具体的查找程序。检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑运算符、位置运算符以及系统规定的其他组配连接符号组成。从某种意义上讲,检索提问式是检索策略的具体体现,它的质量好坏,将关系到检索策略的成败。

检索标识确定后,接下来就是用一定的组配关系把各个检索标识连接起来组成检索提问式,并表达各种复杂的概念关系,以准确地表达信息需求。要注意各种逻辑运算符、位置运算符、截词符等的使用方法,如位置运算符的松紧程度及先后次序,还要考虑各个检索项的限定要求及输入的次序,以及根据反馈信息对检索提问式进行调整等。

2.4.3.2 检索策略

(1)检索策略的概念。所谓检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。检索策略考虑得是否周全,直接影响文献的查全率和查准率。

(2)制定检索策略的步骤。制定检索策略的前提条件是明确数据库及整个检索系统的基本性能。不同数据库收藏内容、标引方法和检索方法是不同的,不同检索系统配备不同的技术性能和操作符。在制定检索策略之前对数据库有几条检索途径,这些途径的标引所遵循的规则都必须有比较清醒的认识。如果在提问式中列出系统没有的检索点,是不可能检出文献的。

(3)制定检索策略的基础是弄清检索课题的内容要求和检索目的。在这一基础上,才能对检索课题进行概念分析,如果课题属单一概念就用单个检索词表达,若课题概念复杂,就把复杂概念分解为若干个概念单元,再用逻辑运算符把表达概念单元的检索词组配起来。将概念单元转换为检索词时,应尽量选用规范化词。检索新课题、边缘学科或是比较含糊的概念时,应特别小心,因为这些词往往没有收入系统,这里应从专业范畴出发选用本学科内具有检索意义的关键词即自由词,不然就会带来误检或漏检。

(4)检索策略构成的关键是正确地选词和配备逻辑符。

(5)调整检索策略。在计算机中检索中,常常会出现文献资料过少甚至为零,或文献资料过多的情况。作为检索人员,应与用户进行分析,及时调整检索策略,以使检索达到令人满意的效果。文献资源过多或过少,均可通过增加检索项,运用布尔逻辑的组配,以增加或缩小检索范围,达到增加或减少命中文献数量的目的。通常来说,逻辑“一与一”总是缩小检索范围,达到查准的目的;逻辑“一或一”总是扩大检索范围,达到查全的目的。而逻辑“一非一”总是排他检索,缩小检索范围,达到查准的目的。

2.4.3.3 检索效率

检索效率就是利用检索系统(或工具)开展检索服务时产生的有效结果。它直接反映检索系统的性能,影响系统在信息市场上的竞争能力和用户的利益。检索效率包括技术效果和社会经济效果两个方面。技术效果主要指系统的性能和服务质量,系统在满足用户的信息需要时所达到的程度。社会经济效果是指系统怎样经济有效地满足用户需要,使用户或系统本身获得一定的社会效益和经济效益。

在检索中最理想的是查全率和查准率都达到100%,就是数据库中收录的全部相关文献都被检索出来,而且检索出来的文献全部都是相关文献。但事实上,检索中有许多因素使这个指标很难达到,总存在一定的误差。那么就出现了两个评价误差的指标——漏检率和误检率。

在评价工作中,最常用的是查全率和查准率,而且应同时使用,否则就难以反映检索系统的功能及检索结果的效率。查准率和查全率结合起来,描述了系统的检索成功率、查全率和查准率之间有着互逆的关系,就是说查全率提高,查准率就下降,反之亦然。在计算机检索中,一般认为查准率为60%~70%、查全率为40%~60%是较为理想的。

系统的收录范围、索引语言、标引和检索等都是影响查全率和查准率的因素。

2.4.3.4 提高检索效率的措施

(1)提高文献库的编辑质量,使它的收录范围更全面、更切合相应学科或专业的需要,著录内容更详细、准确。

(2)提高标引质量,标引前后要一致,用词要恰当,组配要合理,努力做到:正确揭示主题——不错标;全面反映主题——不漏标;简练地使用标识——不滥标。

(3)提高索引语言的专指性和词表质量。加强对索引词汇的控制,完善词表的结构及其参照关系,使索引语言既有利于族性索引,又有利于特性检索。词表结构要完善,词与词之间关系正确,正确控制同义词和多义词,及时反映新学科、新技术的术语等。

(4)提高检索人员的工作水平和能力,了解数据库收集的内容和加深对词表结构的理解,正确做出主题分析,选择合适的检索文档,选择恰当的检索词表达查找主题内容,进行恰当的逻辑组配,找出最佳检索途径,从而制定出最优的检索策略。

(5)调整查全率和查准率。在实际的检索中可合理地调节查全率和查准率,根据不同的检索要求,使检索的结果最大限度地满足检索的要求。在实际检索中,有时对查全率要求很高,希望不遗漏任何一篇有关的文献,而查准率低一点也行;而有时只需浏览一些新的重要文章,不全部要,这里就要求较高的查准率,查全率低一点也行。总之,在检索时要合理地调节查全率和查准率,从而达到最佳的检索效果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈