首页 理论教育 计算机检索步骤

计算机检索步骤

时间:2022-03-16 理论教育 版权反馈
【摘要】:在计算机信息检索过程中,要使最终的检索结果符合科研课题的需要,必须遵循一定的检索步骤,制订检索策略和方法,为检索过程做出科学的安排。计算机检索的具体步骤与方法涉及的内容很广,有时会因课题需求的不同而有所差异,但计算机信息检索的基本步骤是一致的,包括如下几个方面。用布尔逻辑运算符连接检索词形成的检索式,称为布尔逻辑检索式,是计算机信息检索中最常见的检索表达式。

在计算机信息检索过程中,要使最终的检索结果符合科研课题的需要,必须遵循一定的检索步骤,制订检索策略和方法,为检索过程做出科学的安排。计算机检索的具体步骤与方法涉及的内容很广,有时会因课题需求的不同而有所差异,但计算机信息检索的基本步骤是一致的,包括如下几个方面。

1.分析课题,确定主题概念 在进行计算机信息检索之前,对待检索课题进行深入的分析,找出课题中包含的主要概念以及最终检索的目的。要结合相关专业知识,分析课题内容,提炼关键技术和主要概念,并明确这些概念之间的关系。在这个过程中,还应注意课题隐含概念的挖掘和核心概念的选取。把概念分析的结果用自然语言的词或词组表达出来,以便下一步制订检索策略。尽可能使信息需求、信息提问和检索目的三者一致起来。

明确课题的检索目的就是要弄清最终的检索结果是求新、求准、还是求全。求新即要求检索结果能反映课题的最新研究进展,对查全没有过高的要求;求准即要求检索结果具有针对性,能帮助了解课题中的某个细节或解决研究中的具体问题,对查准要求较高而不需要查全;求全即要求检索结果能反映课题研究内容发生、发展和现状,对查全有较高要求,在撰写综述、科研项目查新和专利申请查新过程中往往需要达到求全的检索目的。

最后,还明确所需信息的类型是文献型,还是数值型、事实型;是全文型,还是文摘型;是专利文献,还是一般资料。

2.选择检索方式和数据库 检索方式的选择应根据检索要求而定。一般来说,网络数据库的数据更新速度比较快,因此,当需要查找最新文献信息时,应尽可能采用网络信息检索方式。如果没有合适的网络数据库,可选择数据更新周期短的光盘数据库。当需要做年限跨度较大的回溯检索时,为了节省费用,应尽可能选用相关的光盘数据库。

数据库的选择应考虑各种数据库的回溯年限、专业范围、收录重点和特色及收费标准等。所以,应在检索之前阅读有关数据库的使用介绍,以便选择数据库时做到心中有数。

另外,不同的数据库检索指令、检索语法和规则也不尽相同,应预先熟悉和了解;还要弄清所选数据库的标引规则和词表系统,为确定检索途径做准备。

总之,选择合适的数据库和检索方式是计算机信息检索成功的关键,在上机前,要根据待检课题的专业范围、主题内容、检索要求和目的,选择收录文献种类、专业覆盖面、年代跨度和更新周期对口的数据库及检索方式。

3.确定检索途径 在选择合适的数据库之后,还应根据待检课题的检索目的和要求,确定检索途径。常用的检索途径包括分类途径、主题途径、著者途径和符号途径等。

如果检索课题的内容范围比较宽广和系统时,多采用分类途径。在分类途径中,可按照数据库的分类体系结构,通过分类号或类目词进行扩大或缩小检索范围的族性检索。

如果检索课题所涉及的内容比较专深,往往采用主题途径。在使用主题途径之前,应根据数据库所提供的系统词表,把检索课题的主题内容转换成数据库检索系统能够接受的检索标识或检索词。

常用的检索词有两种:一种是主题词,另一种是自由词。主题词是经过规范化处理的检索词,使用主题词检索可保证较高的查全率和查准率。自由词则由用户根据检索课题需要所提出的词,一般选自用户查阅的文献资料,在实际使用中,应首选主题词检索,提高检索效率,当没有合适的主题词时,才选用自由词检索。

另外,要特别注意正确使用各种主题词表,避免使用专指性太强或太泛指的词;不能使用禁用词(stop words);一般不选用动词和形容词;使用缩写要与全称合用,以免误检。

4.编制检索策略(检索式) 大部分检索课题的研究内容比较专深,检索时往往涉及多个主题概念,并且还要明确这些主题概念之间的关系。编制检索策略是指在正确分析课题主题的基础上,把选择好的检索词或检索标识按检索系统规定或允许的运算符或检索规则连接起来,形成检索式,并提交计算机检索系统进行处理的过程。检索系统中常用的运算符或检索规则包括以下几个方面。

(1)布尔逻辑运算符:是表达检索词之间的逻辑关系的运算符,包括逻辑“与”、“或”和“非”三种类型,分别用and、or和not表示。用布尔逻辑运算符连接检索词形成的检索式,称为布尔逻辑检索式,是计算机信息检索中最常见的检索表达式。

逻辑“与”运算:检索式写成A and B,表示检索结果中同时包含检索词A和检索词B的文献才是命中文献。它的基本作用是对检索词加以限定,缩小检索范围,减少检出文献量,提高查准率。例如,检索“乙肝治疗”的文献可表示为:hepatitis B and therapy。

逻辑“或”运算:检索式写成A or B,表示检索结果中包含检索词A的文献或者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献。它的基本作用是扩大检索范围,防止漏检,提高查全率。例如,检索“肿瘤”的文献可以写成检索式:cancer or tumor or carcinoma。

逻辑“非”运算:检索式写成A not B,表示检索结果中包含检索词A,且不包含检索词B的文献为命中文献。它的基本作用是缩小检索范围,提高查准率。例如,查“动物的乙肝病毒(不要人的)”文献可写成检索式:hepatitis B virus not human。not运算符应该慎用,它容易漏检需要的文献。

在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。在复合检索式中,有时为了强调运算次序,控制最终的检索结果,还经常采用优先处理算符“()”(即括号)。在复合逻辑检索式中,各种运算符的优先级依次为:括号的运算优先级最高,not,and次之,or最低,即()>not>and>or。例如,查“动物乙型肝炎的诊断或治疗”的文献可写成检索式:hepatitis B not human and(diagnosis or therapy)。

(2)位置算符:又称邻近度算符,是逻辑运算符and的延伸,适用于两个检索词在同一篇命中文献中需要指定间隔距离或出现顺序的检索表达式。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一位置算符,检索系统不同,规定的位置算符也不同。例如,有的检索系统用with来表示同字段检索,如果检索式写成A with B,表示A和B不仅要同时出现在同一篇文献中,还要求出现在同一字段中,这样的文献才是命中文献。又如运算符pre3,如果检索式写成A pre3B,则表示A和B两个检索词在同一篇文献中相隔的距离在3个单词以下,并且A必须在B之前出现的文献才是命中文献。

位置算符可以用于改进and运算符的不足之处,更加明确检索词之间的逻辑关系,最大程度地缩小检索范围,提高检索结果的查准率。

(3)字段限定符:将检索词限制在文献特定字段中出现的检索称为限定字段检索,实现限定字段检索的运算符称为字段限定符。常用的有“in”和“=”。例如,文献题目的字段标识符通常为“ti”,那么,查“题目中含有‘AIDS’一词的文献”的检索表达式可写成:AIDS in ti。又如查“2002年发表的文献”的检索表达式可写成:py=2002,其中“py”是文献字段“出版年(publication year)”字段标识符。一般情况下,数据库中文献的所有字段都可做限定字段检索。

(4)截词算符:截词检索是指截取检索词中的一部分进行文献检索的方式。截词方式有后截断(前方一致)、前截断(后方一致)和中间截断(中间屏蔽)等方式。不同的数据库有不同的截词算符,常用的截词算符有“*”和“?”,前方一致检索是最常用的截词检索方式。如在检索系统中输入comput*可查到computer、computing、computerized等所有以comput开头的检索词,最终的检索结果相当于这些检索词做逻辑“或”运算的结果。又如输入wom?n可查到woman和women这两个检索词。灵活运用上述各种运算符和检索规则,就可以编制出一个比较完善、符合检索要求的检索策略(检索式)。好的检索策略是达到信息要求、信息提问和检索效果一致的保证。

5.检索策略的反馈调整 检索策略(检索式)输入检索系统之后,初步检索出的结果有时不一定能满足课题的要求,例如,检索输出的文献过多,而且不相关文献所占比例较大;或者检索输出的文献量太少,有时甚至为零,这时就需要调整检索策略。调整检索策略一般按查全或查准两个原则进行。

(1)当检索结果太多,且查准率较低时,检索式可做如下调整。

①减少同义词或同类相关词;②提高检索词的专指性,尽量采用专指性强的主题词或自由词;③增加限制概念,用逻辑“与”(and)将它们连接起来;④使用限定字段检索,把检索词限定在题目、主题词等主要字段;⑤使用适当的位置算符;⑥减少检索年限,限制检索结果的文献类型(如综述)、语种及出版国,或限定在核心期刊检索。

(2)当检索结果太少,查全率较低时,应扩大检索范围,检索式可做如下调整。

①增加同义词或同类相关词,并用逻辑“或”连接这些词;②降低检索词的专指度,可从词表中选择上位词或泛指词补充到检索式中;③减少限制概念,少用and运算符,删除一些非关键的检索词;④进行扩展检索(族性检索),根据词表的分类结构体系扩展关键的检索词;⑤取消或放宽某些限制过严的字段限制符、位置算符;⑥增加回溯检索年限。如有必要,应对检索式进行多次的反馈修改和调整,直到检索结果满意为止。

6.检索结果的输出 当检索结果符合检索课题的要求和目的时,可以输出最终的检索结果。检索结果可以是题录、文摘、事实数据或全文。注意对题录、文摘型检索结果一定要输出文献信息的来源,以便进一步查找原文。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈