首页 百科知识 经济信息数据库检索方法与步骤

经济信息数据库检索方法与步骤

时间:2022-06-23 百科知识 版权反馈
【摘要】:一、经济信息数据库检索方法与步骤经济信息数据库检索不是简单的操作,而是专业知识和信息检索知识综合应用的过程。一般的经济信息数据库都有布尔逻辑检索的功能,要注意在不同的数据库中使用的布尔逻辑算符不一样。(二)检索步骤开展数据库检索,必须制定合理可行的检索策略。数据库检索包括以下基本步骤。

一、经济信息数据库检索方法与步骤

经济信息数据库检索不是简单的操作,而是专业知识和信息检索知识综合应用的过程。一般包括以下检索技术与方法。

(一)检索方法

数据库检索一般都可使用布尔逻辑检索、截词检索和浏览检索等检索方法。

1.布尔逻辑检索

布尔逻辑检索是利用布尔逻辑运算符连接各个检索词(检索式),并由计算机进行相应逻辑运算,找出所需信息的方法。它也称作“布尔逻辑搜索”。布尔逻辑运算符有下列三种,其作用是把检索词连接起来,构成一个逻辑检索式。

(1)逻辑与算符

中文通常用“*”号、外文用“and”连接检索词,表示结果中必须同时出现所连接的两个检索词,能起到缩小检索主题范围、提高查准率的作用。应用时,出现频率低的检索词置于“与”的左端,可使否定的答案尽早出现,提高检索速度。

(2)逻辑或算符

中文通常用“+”号、外文用“or”连接检索词,表示结果中出现所连接的两个检索词中任意一个就满足检索条件,能起到扩大检索范围,提高查全率的作用。应用时,将估计出现频率高的词置于“或”的左端,可使选中的答案尽早出现。

(3)逻辑非算符

中文通常用“-”号、外文用“not”连接检索词,表示检索结果为不包含某一概念的信息集合,起到缩小检索范围,提高查准率的作用。

一般的经济信息数据库都有布尔逻辑检索的功能,要注意在不同的数据库中使用的布尔逻辑算符不一样。大部分数据库都通过填表式的初级检索方式,即在不同的输入框中输入检索词,选择组配关系执行布尔逻辑检索,有的数据库通过在前一次检索结果的基础上执行二次检索来实现布尔逻辑检索。

2.截词检索

截词检索是指检索时用截词符在合适的地方将检索词截断,用其中的一个局部进行检索的方法。凡满足这个词局部中的所有字符(串)的信息,即为命中信息。截词可在词尾、词头和词中进行,最常用的是词尾截词。

不同的数据库采用的截词符不同,常用的截词符是“﹡”、“?”,按代表所截字符数不同分有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。下面以EBSCO数据库的截词检索举例说明:

(1)后截词

用后截词表示前方一致。如输入“comput﹡”可检出含有computer、computers、computing等的记录。

(2)前截词

用前截词表示后方一致。如输入“﹡computer”可检出含有minicomputer、microcomputers等的记录。

(3)中截词

用中截词表示允许检索词中间有变化。如输入“organi?ation”可检出含有organisation和organization的记录。

3.词组和短语检索

词组和短语检索是指要求检索结果中两个(或多个)检索词相连或相邻,或同在一个字段或子字段中等,从而使检索出的文献更确切地符合用户要求,提高查准率。词组和短语都是由两个以上的词构成的,大部分数据库具备词组和短语检索的功能,不同的检索系统在词组和短语检索中所使用的位置算符的种类和功能有时不完全相同。主要包括:

(1)用特殊符号限定词组或短语

有些数据库用引号来限定词组,例如“Financial crisis”。

(2)用位置算符来限定词组或短语

例如,EBSCO数据库采用的是W和N算符。

(W)算符(WITH)表示两个检索词紧邻,且词序不能颠倒,中间不能插入其他词、字母或代码,但可以有空格或标点符号,也可用()表示;(nW)算符(nWORD)表示两个检索词中间可插入n个词,但词序不能颠倒;

(N)算符(NEAR)表示两个检索词紧邻,词序可以颠倒,但中间不能插入其他词,(nN)算符(nNEAR)表示两个检索词中间可以插入n个词,且词序可以颠倒。

(3)按原样输入词组或短语

在有些数据库中,按原样输入词组或短语,不添加任何限制就可以作为词组或短语来检索。

4.同义词检索

同义词检索是指输入一个检索词后,不仅能检索到包含这个检索词的记录,还能检索出包含那些与该检索词同义的词汇的记录。例如:在维普《中文期刊数据库》中,经过设定,检索“经济危机”时,可以同时检索到包含有“不景气”、“经济恐慌”、“生产不足危机”、“生产过剩危机”等记录的结果。

5.扩展检索

扩展检索是在基本确定检索式的情况下对检索做进一步的限定,使检索结果更加精确,检索速度更快捷。如限定年代、类型、语种等。

6.加权检索

加权检索是某些检索系统中提供的一种定量检索方法,根据检索词对检索课题的重要程度,事先指定不同的权值。检索时,系统先查找这些检索词在数据库记录中是否存在,并对存在的检索词计算它们的权值总和;权值之和达到或超过预先给定的临界值(称阈值),该记录即为命中记录。阈值可视命中记录的多寡进行调整,阈值越高,命中记录越少。

(二)检索步骤

开展数据库检索,必须制定合理可行的检索策略。一项具体的检索策略,包括分析课题、选择检索工具和数据库、拟订检索式以及确定查找步骤等内容。检索策略的优劣直接影响到数据库的检索效果。

数据库检索包括以下基本步骤。

1.分析检索课题

分析检索课题时,要把握好以下两点:

(1)分析所需信息的类型、数量、文种、年限等;

(2)分析检索课题涉及的学科范围、主题内容和有关的主题词分类号等。

2.选择数据库

每一种数据库包含的学科专业范围或主题范围各有侧重,在检索前应充分了解各数据库的类型(是索引还是全文库)、收录学科范围和文献类型、包含的索引种类以及检索途径等。

选择数据库可遵循以下原则:

(1)检索时效性较强的信息应首选网络数据库,信息实时更新;

(2)时效性要求不高的信息可选用光盘数据库,检索速度快,成本低,操作简便。

3.选择检索词

选择表达检索课题内容特征的实质性词汇,或者能反映该检索课题外表特征及其他特征的一些非主题的词汇(如作者、语种、出版年代、分子式等)作为检索词。

为避免漏检和误检,选择检索词时应考虑下列因素和细节:

(1)检索词的所有拼写方法和形式。如:检索有关西红柿的主题,要考虑“tomato,tomoto,an apple of love”或“番茄,番柿,蕃茄”等不同表示西红柿的词,在检索时若只选择其中一个词进行检索,会造成漏检。另外还应考虑检索词的广义词、狭义词、相关词及多义词等,以便根据实际情况灵活调整检索词,达到检索目的。

(2)分析反映检索课题的隐性主题概念词。不仅从题目分析课题查找概念,还要从专业及检索目标与规则等方面分析,找出反映课题本质的检索词,避免漏检。

(3)利用检索系统提供的索引和叙词表选择检索词,防止漏检。外文数据库一般都提供叙词表检索,可以利用叙词表中词间的引见关系,选择检索词,并根据情况取其上位词、下位词、相关词等进行扩检、缩检和相关检索。

(4)巧妙使用截词符。利用检索系统设置的截词检索功能,可以避免输入多个词干相同而词缀不同的检索词,通过一个检索词查出许多相关或相近的信息,提高查全率。在使用截词符进行检索时,要确定每个词的最佳截断部位,避免截得过深,导致高误检率,也不能截得过浅,以防漏检。

(5)注意检索词的缩写和全称,既要用缩写作检索词,也要用全称作检索词进行检索以防漏检。

(6)考虑复合概念词可能拆分的情况。检索时优先使用复合概念词作检索词提高检准率;其次可以把复合概念词或限定修饰词切分成单一概念词,并分别作检索词进行检索;最后用它们的检索项代码进行逻辑组合,以提高查全率。

(7)用化学物质作检索词时,应分别使用化学名称和元素符号作检索词。如用铝元素作检索词,用元素符号Al和英文名称Aluminum分别作检索词进行检索以防漏检。

(8)检索词可包括一些非主题概念词,如作者、年代、语种等。

4.编辑检索式

依据检索课题的具体要求,制定一个最佳的检索式。将选出的检索词通过检索系统提供的各种逻辑运算符号,如布尔逻辑算符、词间位置算符、字段限定算符等进行组配,就构成了一个特定的检索式。

5.实施检索

在计算机上输入检索式检索数据库,根据结果对检索式进行修改,直至得到满意结果。

6.处理检索结果

检索结果的浏览和输出非常重要,多数数据库中检索结果都是以题目、题录、文摘和全文的形式分级浏览。检索结果一般按相关度排列,也可以根据需求选择其他的排列方式;可以通过存盘、打印和E-mail等多种形式输出。在全文数据库中,不同的数据库采用不同的浏览器,大多数数据库使用的是Acrobat reader浏览器。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈