首页 理论教育 信息检索的方法、途径及评价

信息检索的方法、途径及评价

时间:2022-10-31 理论教育 版权反馈
【摘要】:这是以化学物质的分子式作为检索标识来查找文献的途径。从而满足信息检索的需求。它是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度。

2.4 信息检索的方法、途径及评价

2.4.1 检索方法

信息检索的方法很多,归纳起来主要有以下几种:

1.浏览法

这是科技人员平时获取信息的重要方法。具体地说就是科技人员对本专业或学科的核心期刊每到一期便浏览阅读的方法。该法的优点是:能最快地获得最新信息;能直接阅读原文内容;基本上能获取本学科发展的动态和水平。缺点是:科技人员必须事先知道本学科的核心期刊;检索的范围也不很宽,因而漏检率较大。

2.追溯法

这是一种传统的查找文献的方法。就是当查到一篇参考价值较大的新文献后,以文献后面附的参考文献为线索,由近及远,进行逐一追踪的查找方法。此法的优点是:不需要利用检索系统,查找方法简单;缺点是检索效率不高,漏检率较大。

3.常用法

也叫检索系统法,是使用检索系统查找文献的方法。这种方法又可分为顺查法、倒查法、抽查法、引文法等四种。

(1)顺查法。即由远及近的查找法。如果已知某创造发明或研究成果最初产生的年代,现在需要了解它的全面发展情况,即可从最初年代开始,按时间的先后顺序,一年一年地往近期查找。此法的优点是查全率较高,缺点是费时费力,工作量较大。

(2)倒查法。即由近而远的查找法。此法多用于查找新课题或有新内容的老课题。在查找中一般注重查阅近期资料,不必一年一年地往前查到底,只需查到所需资料够用时为止,可节省不少时间,但漏检率较高。

(3)抽查法。这是利用某一学科的发展一般是波浪式的特点进行查找的方法。当该学科处在兴旺发展时期时,科技成果和发表的文献一般也很多。因此,只要针对发展高潮期进行抽查,就能查获较多的文献资料。

(4)引文法。这是利用引文索引查找文献的方法。查找时,以某一特定论文的著者为对象,进行追溯检索。

4.分段法

又称循环法,是交替使用“追溯法”和“常用法”来进行检索的综合检索方法,即利用检索系统查到一批文献资料,又利用这些文献资料所附的参考文献追溯查找,这样分期分段地交替进行,循环下去,直到满足检索要求为止。分段法的优点在于,当检索系统缺期、缺卷时,也能连续获得所需年限以内的文献资料。

2.4.2 检索途径

信息检索的途径一般有如下四种:

1.分类途径

这是按照学科分类体系查找文献的途径。使用的检索语言是分类语言。使用的检索系统有“分类目录”、“分类索引”等。用分类途径检索的优点是,它能把同一学科的文献集中在一起,便于族性检索;缺点是新兴学科、边缘学科在分类时往往难于处理,查找不便。另外,从分类途径须了解学科分类体系,否则在将概念变换为分类号的过程中容易发生差错,造成漏检或误检。

2.主题途径

这是按照文献的主题内容查找文献的途径。使用的检索语言是主题语言,使用的检索系统是“主题索引”、“关键词索引”、“叙词索引”等。这种途径以文字作检索标识,索引按照主题词或关键词的字顺排列,检索时就像查字典一样,不必考虑学科体系。用主题途径检索的优点是,它用文字作检索标识,表达概念准确、灵活,能把同一主题内容的文献集中在一起,便于特性检索。

3.著者途径

这是根据已知著者名称来查找文献的途径。使用的检索系统有“著者目录”、“著者索引”等。由于从事科学技术研究的科技人员多有所专长,发表的文献一般有连贯性和系统性,所以通过著者索引可检索到某著者对某一专题研究的主要文献;缺点是必须预先知道著者姓名,必须配合主题途径或分类途径使用,才能取得较好的检索效果。

4.其他途径

其他途径包括篇名途径、序号途径、分子式途径等等。

(1)篇名途径。篇名途径包括书名、刊名和篇名等途径。这是根据书刊名称或文章的篇名所编成的索引或目录查找文献的途径。使用的检索系统有“图书书名目录”、“期刊刊名目录”、“会议资料索引”等目录或索引。这类检索系统一般都按图书,期刊、资料的名称字顺编排,多用于查找馆藏图书和期刊。

(2)序号途径。序号途径包括报告号、标准号、专利号、登记号等途径。这是根据特定号码符号等来查找文献的途径。使用的检索系统有“报告号索引”、“标准号索引”、“专利号索引”、“登记号索引”等。

(3)分子式途径。这是以化学物质的分子式作为检索标识来查找文献的途径。使用的检索系统是“分子式索引”。从分子式索引中查出化学物质的准确名称,然后转查“化学物质索引”。该途径主要在美国《化学文摘》中使用。

2.4.3 信息检索效果的评价

信息检索效果就是利用检索系统进行检索服务时所获得的有效结果,常以检索期望与实际的比率来作为评价指标。在信息检索时,检索者总希望将检索系统中与所需信息相关的全部记录都检出来,总是希望能够明确的知道自己检索的效果。因此,对检索效果进行评价,不但可以提高检索系统的应用水平,还可以借此分析影响检索效果的因素,调节检索策略,提高检索效果。从而满足信息检索的需求。

1.信息检索效果评价的指标

常用的信息检索效果评价指标有:查全率、查准率、漏检率、误检率和响应时间等。其中最主要的指标是前四种。假设检索系统各参量如下,见表2-2:

表2-2 检索系统参量表

img10

(1)查全率。它是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度。

查全率=检出相关信息量/系统中相关信息总量×100%=a/(a+c)×100%

(2)查准率。它是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度。

查准率=检出相关信息量/检出信息总量×100%=a/(a+b)×100%

查全率反映所需文献被检出的程度;查准率则反映系统拒绝非相关文献的能力。两者结合起来反映检索系统的检索效果。研究表明,查全率与查准率之间存在互逆的关系,即提高系统的查全率,会使查准率下降,反之亦然。

(3)漏检率。它是指漏检相关信息量与在检索系统中相关信息总量的比率,是衡量信息检索系统漏检信息的尺度。

漏检率=漏检相关信息量/系统中相关信息总量×100%=c/(a+c)×100%

(4)误检率。它是指误检(检索出不相关)信息量与检出信息总量的比率,是衡量信息检索系统误检信息程度的尺度。

误检率=误检信息量/检出信息总量×100%=b/(a+b)×100%

2.影响检索效果的因素

(1)影响查全率和查准率的主要因素 影响查全率和查准率的因素很多,但都包含在检索系统编制质量和检索方法这两者之中。这些因素可分为人为因素和客观因素两方面:①人为因素。主要包括两类人为错误因素:一是在编制检索系统时收录文献不全面、不明确,在文献标引工作中人为造成的各种错误;二是在检索时对课题内容分析的错误和对检索提问错误。人为错误往往会引起查全率和查准率的同时下降。人为因素也称“不合理影响因素”,由此造成的误码检和漏检称为“不合理误码检”和“不合理漏检”。②客观因素。在检索过程中,无论怎样调整检索策略,无论怎样改进检索系统的质量,都无法使查全率和查准率同时达到100%,这表明了它们的互逆相关性。也就是说,在排除了人为因素的情况下,任何提高查全率的措施都会降低查准率,反之亦然。其根本原因不是在检索系统本身,而是在检索对象——文献,更确切地说是文献所反映的各个学科知识之间的普遍联系。各种知识之间的相互渗透、相互包容是影响查全率和查准率不可能同时达到100%,而成为反比关系的客观因素。这些因素称为“合理影响因素”,由其造成的误检和漏检称为“合理误检”和“合理漏检”。

查全率和查准率之间的互逆相关性是由英国C.W.Cleverdon领导的Cranfield试验所发现的,可用图2-5表示。

img11

图2-5 查全率与查准率互逆相关性曲线

(2)影响检索效率的因素 对检索用户来讲,最关心的是检索效率,而影响检索效率的主要因素是标引的网罗性和检索标识的专指性。①标引的网罗性。标引的网罗性是指标引时揭示文献主题的基本概念的广度而言的。例如,查找题为:“计算机检索软件设计”的有关文献,经过主题分析后选出“计算机检索”、“文献检索”、“程序设计”三个检索词。从标引的广度所包含检索词的角度看,还应补加上“检索程序”和“应用程序”两个检索词,否则就会漏掉相关文献,影响查全率。因此,标引的网罗性是影响检全率的重要因素。②检索标识的专指性。所谓检索标识的专指性是指检索标识表达主题的基本概念的专指度而言的。例如,查找题为:“计算机在信息检索中的应用”的有关文献,经过主题分析后,选出“计算机”、“信息检索”和“计算机应用”三个检索词。从主题的专指性来看,计算机的下位概念是“电子计算机”,情报检索也还包括“文献检索”、“数据检索”和“事实检索”,这些词都应考虑,否则就可能影响查准率。因此,检索词的专指性是影响查准率的一个重要因素。

3.提高检索效率的措施

检索系统的优化过程是避免和克服不合理因素,在此基础上将合理因素调整到最佳化的过程,这样就可以提高检索效率。提高检索效率的措施主要有以下几条:

(1)选择好检索系统。既注意选择质量较高的检索系统,又要选用适合检索课题需要的检索系统。

(2)准确使用检索语言。检索者所用的检索语言应能准确地表达信息需求。如果检索系统使用的是标题词语言,那么,用户应从标题词表中选准检索词;如果是体系分类语言,则检索者也应从分类表中选准分类号。

(3)用泛指性强的检索语言以提高查全率。如果有其上位类号、上位主题词以及相关主题词,就能获得较多的文献,提高了查全率;但随之误检的文献增多,使查准率下降。

(4)用专指性强的检索语言以提高查准率。如果采用下位类号、下位主题词以及经组配后的专指检索词,就能提高查准率;但由于漏检的文献增多,使查全率下降。

(5)善于利用各种辅助索引。一种检索系统通常有多种辅助索引,提供多条检索途径。用户应根据自己掌握的检索课题的外表特征和内容特征,选用相应的索引来检索。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈