首页 百科知识 联机检索技术在图书情报工作中的应用和评价的研究

联机检索技术在图书情报工作中的应用和评价的研究

时间:2022-08-25 百科知识 版权反馈
【摘要】:联机检索又称在线检索,是计算机技术、通信技术在图书情报工作中的一项重大应用。但是,同国外相比,我国的联机检索的应用还比较落后。联机检索机构中目前这部分工作的比重是比较大的。在科研过程中,需要及时了解国内外该领域中的成果及进展状况,通过联机检索可以获得数以千万计的科技论文、研究报告、专利文献等。联机检索系统应在最大程度上满足用户的信息需求。合理选择联机检索系统,并不是一个简单的问题。

联机检索技术在图书情报工作中的应用和评价的研究[2]

一、引言

联机检索又称在线检索,是计算机技术、通信技术在图书情报工作中的一项重大应用。联机检索于20世纪60年代初出现于美国,经过几十年的发展,联机检索已成为信息服务业的一大支柱产业,为世界经济和社会发展发挥了重要作用。联机检索有信息面广,信息量大,内容新,实用性强等特点;另一方面,联机检索速度快捷、响应及时、功能强大、交互性好,为信息资源的共知、共享与交流提供了技术保障,在西方发达国家,联机检索技术的应用十分普遍,几乎所有的高等院校、政府机构、科研单位以及许多大、中型工商企业都建立了联机检索系统。我国在80年代初引进了联机检索终端。东南大学于1984年11月建立了DIALOG联机检索终端,为校内外用户科技查新和信息检索提供了便利条件。在近十几年中,国内的联机检索系统也得到迅速发展,为我国的经济建设提供了不少重要信息。但是,同国外相比,我国的联机检索的应用还比较落后。随着产业信息化、国民经济信息化和社会信息化的发展,我国经济建设对信息的需求将与日俱增,而联机检索作为获取信息的重要手段之一,必将在我国得到更加广泛的应用。

二、联机检索在图书情报工作中的应用模式分析

(一)联机检索在我国的应用领域

1.经济领域中经济情报和竞争情报

随着我国经济、社会的发展、工商企业对信息的需求日渐强烈,人们需要了解产品的最新动态,需要了解竞争对手、竞争环境的情报;需要了解国内外市场的瞬息变化状况,把握住市场信息;需要最新的专利、生产过程、技术革新的信息以及目前行业的技术标准和指标等等。信息被视为市场竞争中可以出奇制胜的法宝,而联机检索则是信息检索和传递的重要手段之一。

企业的查新工作是一项非常具有中国特色的联机检索服务,也是企业产品得到确认的基本前提。联机检索机构中目前这部分工作的比重是比较大的。联机检索的特点有:可检索的信息资源时间跨度长,信息新颖,覆盖面广。近些年来,我国的联机检索服务部门对广大的工商企业用户,特别是一些外贸与金融企业用户的对口服务有待加强。工商企业用户在国外是联机检索系统的最大用户(约占用户总数的50%左右),而在我国这类用户仅占用户总数的7%左右。悬殊的数字对比说明我国工商企业用户的潜力很大。我们应加强对用户信息价值意识的宣传教育,要说明联机检索费用虽高,但其信息价值更“高”,可以获得更大效益。

2.科研单位中的科技信息

在科研过程中,需要及时了解国内外该领域中的成果及进展状况,通过联机检索可以获得数以千万计的科技论文研究报告、专利文献等。

3.各级政府机构也是联机服务的主要用户

政府既是最大的科技项目资助者,又是科技文献最大的组织者和出版者。有的数据库则只存在于政府部门的检索系统上,政府机构通过联机系统提供必要的公共信息。

4.高校图书馆

高校是联机服务的最早用户,但对于非理工医农类院校来说,目前发展仍然比较缓慢。主要原因是不少学者仍倾向于采用文献型信息检索工具,通常是以传统的参考咨询服务为主,以联机检索为辅。当然,这其中也有经费有限的因素。

(二)建立我国联机检索应用模式的总原则

根据以上对国内外联机检索系统的分析,我们提出建立我国的联机检索应用模式的总原则为:适合国情,面向用户,效用大,成本低。下面将逐条进行阐述:

(1)适合国情

信息工作要为经济建设服务,这是我们的指导原则。联机检索应用模式应该适合我国的基本国情,促进我们的经济建设。我国目前正处在社会主义初级阶段,物质和资金还比较薄弱,这就决定了我国的联机检索物质技术投入不可能很多。而我国正在积极进行经济体制改革,发展社会主义市场经济,从长远来说,我国的经济、社会、政治对信息的需求会逐渐增加,联机检索将有很广阔的应用前景。但是,我国在计划经济体制下所形成的弊端尚未完全消除,联机检索整体格局也急需调整,我们的任务还很艰巨。

(2)面向用户

联机检索系统归根结底是为用户提供他们所需要的信息,满足用户的情报需求是联机检索系统存在的基础和目的。因此,联机系统的建设与发展,应该使系统更加贴近用户并直接为用户所利用。面向用户的联机系统是社会自动化程度普遍提高、信息联网环境下的必然发展趋势。这种联机系统的用户界面友好,设计更加趋向用户直观思维,让计算机更符合人的需求。同时,联机系统应尽可能减轻用户的思想负担,使用户不用更多的培训便可以在系统本身的指引下完成检索任务。检索专家的作用体现在:帮助用户面向系统,帮助系统面向用户。可以说,联机检索系统发展的基本趋势是由面向检索专家转向面向广大信息用户。

(3)效用大

联机检索系统应在最大程度上满足用户的信息需求。目前,联机检索机构作为信息用户和联机系统的中介机构,起着重要作用:一方面,将用户的信息需求转换成检索目的;另一方面又要将用户的检索目的转换成系统的检索语言。系统能否使检索达到最大效用,很大程度上决定了该联机系统的信誉和利用率。

(4)成本低

联机检索的费用是比较高的,这就需要设计一个比较好的检索策略以降低费用。检索系统、文档的选择,检索入口的选择(主题词、关键词等),手工检索工具的灵活运用,选择合适的打印方式,检索时用户是否在场等在一定程度上都可以减少检索时间,降低检索费用。

效用最大、成本最低,这两个原则在一定条件下是互相抑制的,但从经济学的观点看,这两条原则是可以找到一个平衡点的。因此在联机检索作业时,我们要综合考虑各个因素,努力在成本最低的前提下实现效用最大化。

(三)我国联机检索应用模式

1.联机检索系统的基本应用程序

(1)明确课题的学科范围,确定检索目标

通过用户填写好提问单,明确课题的学科范围,确定检索目标。根据提问单,对课题进行概念分析,找出最能代表主题概念的若干个词或词组,并详细分析概念之间的关系,如上下位关系,相关关系。对于新学科,特别是交叉学科、边缘学科,更要透彻分析主要概念之间的左右关系、交叉关系等。概念分析得越透彻,检索策略才可能制定得越合理。对于不同的课题,要确定出不同的检索目标。如对于专利查新一类的课题,则应尽可能检索出与之相关的全部文献,即要求有较高的查全率;如属技术应用一类的课题,则应尽可能地检索出与之密切相关的那一部分文献,即有较高的查准率。

(2)选择检索系统和数据库文档

各个不同的联机检索系统的数据库学科专业范围不同,检索指令不同,收费标准也不同。合理选择联机检索系统,并不是一个简单的问题。例如,同一种数据库可能同时有几个联机检索系统提供,但它们对数据库的组织方式可能各不相同,收费标准也有区别,对于数据库更新的周期长短不一,所提供的检索功能也不完全一样。此外,各个联机检索系统所能提供的有关服务项目,如原始文献的提供、电子邮件、培训服务,节目辅助材料等,也是有差异的。至于各个检索系统的整体数据库资源水平、响应速度、可靠性、可供使用的通信设施的方便性等,也是选择联机系统及文档时要考虑的重要因素。因此在检索之前,应对常用的几个系统的文档介绍和使用说明之类的工具书仔细研读,做到心中有数。

(3)制定合理的检索策略

广义上讲,检索策略就是根据情报需求提出的条件和目标确定查找信息的步骤、途径、程序和方法。对一个检索课题来讲,要达到什么目标,要求什么范围,选择什么检索系统,要通过什么途径,选用什么检索词和逻辑组配方法以及需要哪些信息反馈等一系列问题都属于检索策略的研究范畴。从狭义上讲,检索策略是一种将情报需求准确变换成检索系统所能够识别的检索提问标志的具体步骤和方法。它主要包括两方面:

1)确定检索词

正确选词是检索成败的关键。凡有词表的文档,应尽可能根据词表选词;没有词表的,则可根据课题的主题内容选常用词汇、专业词汇做检索词。但是应尽量避免使用application、effect、manufacture等高频且针对性差的词,也应尽量避免选用冷僻词和自造词。

2)编制提问逻辑式

用布尔逻辑运算符,位置逻辑运算符,截词,加权等办法,编制能准确表达提问主题的提问逻辑式。有条件的话,还应编制一二套备用的提问逻辑式,以便在检索结果不理想时,作扩检或缩检用。

(4)确定检索途径和检索方法

确定检索途径和检索方法,即确定是主题还是非主题途径。或者在单一途径检索效果不尽完美时,同时选用主题或非主题途径,并用各种逻辑运算符将其完美结合起来;确定是字段检索还是全文查找,确定查找年限、语种限制等。

(5)初步评价结果,决定输出方式

信息用户最好与检索人员一起参与检索全过程,以密切观察人机对话的过程,敏捷地对每一步检索结果作出最初判断,随时修改检索提问。对于检索输出的结果,可以选择系统所能给出的输出格式。不论选择何种格式,要注意即使检索结果一目了然,又达到节省联机费用的效果。一般情报下,检索结果都采用脱机打印方式,因为联机打印费用较高。

2.我国联机检索应用模式构造

通过对我国联机检索应用领域、应用状况及基本操作层的研究,我们提出了我国联机检索应用的基本模式,该模式具有以下几个特点:

(1)可行性

这套检索模式基于大量联机检索实例的总结,具有很普遍的适用性。

(2)动态性

这套检索模式的操作过程中在很多步骤上都可以及时调整,使检索结果动态地逼近检索要求。

(3)反馈性

这套模式提供了几条信息反馈途径,对检索结果进行信息反馈处理,达到既定的检索目标。

(四)联机检索系统应用技术问题

1.联机检索用户情报需求分析技术

用户的信息需求是产生科技创新活动的动机,是信息系统运行的起因和目的。联机检索要充分重视用户的情报需求的分析,检索系统应以用户情报需求为核心。用户的信息需求可以分成四类:

(1)信息需求目的明确,表达清晰。通常这类信息用户是从事某一领域的活动时间较长,经验丰富,对信息检索系统也有一定了解。在指定的主题词和文档下,这类检索简洁明快,效果明显。

(2)信息需求目的明确,表达却不清晰。这类信息用户在头脑中也已经形成明确的信息需求,只是没有找到合适的专业词汇表达出来。如某一乡镇企业了解到某种产品性能较好,却不知道其名称,这就需要检索人员有足够的耐心,引导用户,动态地制定检索策略,及时调整,以满足用户的需求。

(3)信息的需求目的明确,却因某种原因,不肯将其清晰地表达出来。比如某一信息需求涉及用户的商业秘密,用户出于谨慎不愿将其道破,这就需要信息检索人员有相当丰富的经验和广博的知识,充分揣摩用户的需求,做出让用户满意的检索结果。

(4)信息需求目的不明确,表达也不明确。这类信息需求往往只是用户头脑中尚未成形的信息需求,比如某科技人员头脑中突然闪现的一种想法,只是一种简单的描述,无法确定其概念。这时,检索人员可以扩大情报检索范围,进行族性检索或跨文档检索,从而找到合适的结果。但是对这种检索的结果不便进行评价,因为检索的标准并不明确。

联机检索系统的设计和管理人员应在进行数据库结构组装时,就考虑到实际的信息需求,从而使联机检索工作有的放矢,适应信息市场变化。具体做法是:可以定期组织终端服务人员、信息用户进行调查,将用户的信息需求及时反馈给系统开发人员,促进联机检索服务的良性运作。

2.检索策略制定技术

构造一个良好的检索策略,往往涉及各方面的知识和技能。如:是否了解检索系统特性与功能;是否熟悉所检索数据库的标引规则及词表结构;是否掌握了必要的检索方法与调节技术;是否了解所检索课题的专业知识等。美国人鲍纳提出的五种供联机检索用的检索策略,影响面最广,它们分别是:

(1)“最专指面优先(most specific facet first)”。用户检索时,首先选择从课题的最专指的概念面入手,浏览结果如发现检得的文献相当少,那些检索者通常不把其他概念面再加到检索式中。这些其他概念面是供选择用的,只有在检索要求较高的查准率时才需输入。

(2)“最低登录量的面优先(lowest pasting facet first)”。所谓登录量,是指一个索引词在标引中的使用次数。该策略是先根据词的登录量值,找出登录量最少的那个概念面,然后以此作为检索入口开始检索。如命中文献相当少,就不必再继续检索其他的面。

(3)“积木型(build-block)。”即把检索课题剖析成几个概念面,先分别对这几个概念面进行检索;在每个概念面中,尽可能全和多地列举相关词、同义词、近义词,并用布尔算符“OR”连接成检索式,然后再用“AND”把所有概念面的子检索式连接起来,构成一个总检索式。

(4)“引文联珠状增长(citation pearl-growing)”。这种策略从直接检索课题中最专指的概念面开始,最少检出一篇命中文献,然后审阅这批文献,从中选出一些新的相关检索词,补充到检索式中,这些词加入到检索式之后,就能查出更多的命中文献。重复上述过程,直到找不到其他适合包含于检索式的附加词为止。

(5)“逐次分流(successive fractions)”。先确定一个相当大的范围较广的文献初始集,然后提高检索式的专指度,得到一个较小的命中文献集;继续提高检索式的专指度,逐渐缩小命中文献集,直至得到数量合适、用户满意的命中文献集合群。

3.检索式的反馈调整技术

检索式的反馈调整技术,我们可以从查全率、查准率这两个主要的检索效果评价指标分别做分析。

对于需要较高查全率的课题,主要从扩检入手,检索式调整可选用的方法有:

(1)降低检索词的专指度,可从词表或检出文献中选一些上位词或相关词补充到检索式中;

(2)调节检索式的网罗度,如删去某个不甚重要的概念面;

(3)进行族性检索,可采用分类号检索或采用一些近义词、同义词、相关词用“OR”连接;

(4)进行截词检索,可以采用的有后截断、前截断、前后截断等办法;

(5)增加检索途径,如将主题途径与非主题途径结合起来;

(6)取消某些限制过严的前后缀符、限制符等。

对于需要高查准率的课题,一般是在有一定查全率的基础上再进行缩检,可采用的方法有:

(1)提高检索词的专指度,增加或换用下位词和专指度较强的自由词;

(2)用AND连接一些进一步限定主题概念的相关检索项;

(3)限制检索词出现的可检字段,用位置符控制检索词的词间顺序与位置;

(4)利用限制符、前缀符等限制文献的外部特征;

(5)利用NOT限制不相关文献的输出,减少检索噪音;

(6)进行加权检索,从定量角度进行检测。

三、联机检索在图书情报工作应用中的评价体系

(一)检索系统评价的概念和意义

评价是根据给定的指标体系,采用一定的方法和程序,对联机检索系统以及各组成要素的功能、特性和运营情况进行评测,或者对评价对象有关的某些假设、预期效益或性能值进行验证,以确定系统到了何种水平,投入的成本是否值得,是否可以改进和如何改进,乃至系统是否应该生存下去。

意义:

(1)提高资源分配的合理性,争取在不增加投入(或适当降低投入)的前提下保持或增加系统的效率与效益;

(2)保证联机检索系统可以提供高质量的服务;

(3)分析系统存在的缺陷及其原因,提出改进意见;

(4)有助于开发新的联机检索系统。

(二)联机检索应用系统的基本因素分析

目前我国广泛应用的是委托式检索,即用户将信息需求委托给检索人员完成。因此,信息用户、检索人员和联机系统构成了更大意义上的一个人—机交互系统。这一大系统包含有两个接口:信息用户—检索人员,检索人员—联机系统。分析这一人机系统的结构及其影响因素,是我们进行系统评价工作的基础。

上表是联机检索系统的基本要素,我们可以将其归纳为:人、机、环境因素。一是用户信息需求的表达,检索人员对信息需求的理解;二是联机系统的因素,联机系统的功能是否完备,系统软件设计的质量,系统辅助检索词表,说明书是否齐全;三是外部环境因素,社会政治经济环境直接影响用户的信息需求以及信息活动的实现。

(1)人的因素分析

在联机系统中,人的因素居于主导地位,联机检索行为受到人的检索意向支配。系统中人的因素分为信息用户因素和检索人员因素两大类。用户的基本心理包括:求快心理,希望在最短时间内获得自己所需的信息;创造、发明取得成果的创造心理;以最小努力获得最大收益的省力心情;费用比例最小心理等。检索人员应具有良好的心理素质,他们应具有较高的分析能力,足够的耐心和信心,以及丰富的联机检索经验。

据统计,在造成联机检索失误的诸多因素中,人为因素占总数的35%。可见,提高检索用户和检索人员的检索素质水准十分迫切。

(2)机的因素分析

在联机检索人—机系统中,直接影响检索效果的重要因素是人—机界面设计问题,包括物理界面(键盘、显示器等)和认知界画(操作系统、检索语言、软件、文档等),在众多的因素中,检索语言和词表又是关键性的。

检索语言分为受控语言和不受控制语,目前以受控语言为主,它是对自然语言的一种规范,使用检索语言能够提高检索效果,但是,却因为限制了人们使用自然语言进行交流而带来了语言束缚。自然语言灵活性大,可以不依赖于词表、分类表对检索对象进行标引,因而,自然语言受到用户的欢迎。但对系统而言,它的标引一致性差,查全率低。两者的有机结合将促进检索系统效果的提高,易于标引和检索,尽可能多地满足检索要求。

词表是联机检索不可缺少的工具。词表主要反映语词的专指度、词间关系和结构。人机系统理论认为,词表结构不能仅依靠人来适应词表,而应在词表反映检索内容的基础上,符合人的检索习惯、理解能力和视觉能力。

(3)环境因素

环境是制约和影响人的活动的外部条件。社会经济、政治、信息技术、法律等环境对联机系统有着必然的影响。全球的“知识经济”发展的驱动促进了联机系统的发展和更广泛的应用。

联机检索系统是各个组成要素按照一定的目的和功能组成并相互作用的有机整体。任何系统都应具有集合性、相关性、目的性和环境适应性。联机系统的人、机、环境等各要素之间互为作用、互相影响。这也要求我们充分了解各要素之间各种形式的联系,协调各要素、各单元之间的关系,以发挥它们的最佳功能。

(三)联机检索应用系统评价指标体系设计

1.评价的类型

(1)宏观评价:对检索系统的宏观方面,如收录范围、信息源类型、系统结构、利用率、影响等进行考查比较。

(2)性能评价:测定检索系统的质量或服务效果,即满足用户需求的程度。

(3)费用/效果评价:考查系统达到某个性能水平与所需费用之间的关系。

(4)费用/效益评价:考察系统的服务效益与费用消耗之间的关系,了解其成本/效益比是否合理。

2.评价的原则

对联机检索应用系统的考量应该遵循一套科学的评价标准,可以操作和计量。一般系统的评价应该具有科学性原则、反映关键词原则、注重可行性原则。下面,将介绍联机系统评价应具有的原则。

(1)注意联机系统应用及趋势原则

对一个应用系统的评估,不但要重视目前的发展情况,还要从发展的角度来评价其未来走势。只有这样,才能进行全面、动态、有效的评价。

(2)定性与定量相结合的原则

对应用系统的现状、效果评价可以采用定量的方法,运用统计、数学方法进行数值计算;而对于反映应用系统中趋势性、目标性、模糊性的指标,我们很难找到具体的公式进行运算。所以采用定性的方法进行概念上的分析和评价也是必要的。

(3)兼容性原则

联机系统的终端在全国有几百个,对于每个实际的应用系统都存在许多具体的、现实的情况。开展对于实际应用系统的评价须针对应用系统中基本性、可比性的问题,使该评价指标体系具有相当强的兼容性。

3.评价的方法有:(1)单系统调查分析法;(2)多系统比较分析法;(3)问卷调查法;(4)检索实验评价法。

4.联机检索系统的评价指标体系

首先,我们对几个重要指标加以说明:

(1)信息收录完备性—收录跨度。系统数据库覆盖的学科范围、信息类型、数量和时间跨度。

img230

(2)查全率——系统在实施某一检索作业时,检出相关文献的能力。

img231

(3)查准率——系统在实施某一检索作业时,拒绝不相关文献的能力

img232

(4)响应时间——在委托检索中,它表示从提问到收到检索结果所用时间;在非委托检索中,它表示用户的实际检索时间。

(5)用户努力——用户在检索过程中所做的努力,包括智力和体力。

(6)囊括值——与某一提问相关的文献在文献集合中的分布密度,分布密度愈大愈易检出。

img233

(7)检出每条相关记录的单位成本。

(8)检出每条新的相关记录的单位成本。

(9)获得每篇相关文献原文的单位成本。

应用层次分析联析法对联机应用系统进行多级评价,建立的指标体系如下:

img234

5.评价算法

设A为权重集,A={a1,a2,a3

R为评价分值组成的评价矩阵

评判得:B=AR={b1,b2,…,bi,…,bn

(1)综合评价集的计算

采用多级模糊综合评判法,从最底层开始,逐步上移。

该体系有三层:目标层、准则层、指标层

求准则层第i个指标的综合评判集成Bi

Bi=AiRi=(bi1,bi2,…,bip)(i=1,2,3)

其中,Ri为评价因素Ui的评价矩阵。

img236

(2)目标层综合评价集B

img237

B=A*R

其中A为准则层相应于目标层各指标的权重要集,等于[a1,a2,a3]。

评价结果分析。本评价模型的建立是为了估测联机检索应用效果,为评价联机检索的效果提供了定性定量的依据,可获得改善联机工作的思路。

(四)改进联机检索应用系统效果的建议

1.开发系统语言、检索语言和用户语言集于一体的混合型检索语言系统

检索语言这一检索技术是对人机系统的信息载体进行分析和研究。自然语言在弥补受控语言缺点的同时,自身也产生了新问题。根据人的检索心理特性及其检索行为研制集系统语言、检索语言和用户语言于一体的混合型检索语言系统,是联机检索研究的新领域。

2.大力普及计算机教育,改变委托式联机检索方式

面向用户联机检索系统的发展,可以使用户直接面向联机系统进行检索。随着计算机教育的发展,大力加强信息联机检索的教育和培训,可以进一步提高联机检索效果,打破由专职检索人员根据用户提问进行信息检索的清一色的服务方式。

3.建立联机检索应用系统行为模式

目前,利用现有的联机检索人机系统条件,提高检索效果的最直接、最经济的途径是注重人的因素。进一步研究模式识别(如语句、声音、图形、图像等多媒体信息)以及自然语言的理解,探索一种联机检索行为的标准模式是联机检索中的一个研究方向。

4.确定检索人员的专业标准

在联机检索应用系统中,系统的分析、操作、管理必须由具备一定专业知识和较完备知识结构的人员来完成。对检索人员的培训应提到议事日程上来,尤其是目前信息技术发展很快,知识更新周期变短,检索人员的业务标准要随着这些变化重新设定。

5.重视用户心理行为因素的影响

应依据用户的行为心理特征作为联机应用系统的重要的指导思想,这不仅要体现在人机界面上,还要体现在检索操作中能完善地结合于相应的硬件设备方面。

参考文献

[1]邓汉成.国际联机检索的原理与方法.北京:兵器工业出版社,1992年

[2]曾民族.信息高速公路环境下信息管理服务的再设计.情报学报,1995年第4期

[3]龚国伟.试论提高我国联机检索服务水平的几个问题.图书情报工作,1996年第1期

[4]赵文.面向最终用户:检索系统的趋势及其原则.图书情报工作,1996年第4期

[5]严怡民.情报系统原理.科学技术文献出版社,1988年

[6]张厚生.信息检索.南京:东南大学出版社,1997年

[7]王以群.情报联机检索人—机系统效果综合分析与设想.情报学报,1996年第2期

[8]刘冬红.试论联机服务系统的模式管理.福建图书馆学刊,1996年第1期

[9]贾晓芳.1994年度中情所国际终端服务系统服务量统计.联机与信息,1995年第2期

(李雪合著)

《东南大学学报》(社会科学版),1999年第2期

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈