首页 百科知识 医学文献检索的原理和语言

医学文献检索的原理和语言

时间:2022-06-20 百科知识 版权反馈
【摘要】:文献信息检索的基本原理是指通过一定的方法和手段,将检索提问的标识与存储在检索工具中的文献特征标识进行比较,达到一致,以便有效地提取和利用文献。计算机信息检索系统由文献信息存储和检索2部分组成。外表标识检索语言是描述文献外表特征的检索语言,是依据文献外表特征,如文献名、著者、文献序号等作为文献存贮标识和检索提问出发点而设计的索引语言。美国《医学主题词表》是使用最多的一种主题检索语言。

第四节 医学文献检索的原理和语言

一、医学文献检索的原理

(一)文献信息检索的基本原理

文献信息检索的基本原理是指通过一定的方法和手段,将检索提问的标识与存储在检索工具中的文献特征标识进行比较,达到一致,以便有效地提取和利用文献。

文献信息检索包括文献信息的存贮和检索两个过程,是利用检索工具来实现的(图1-4-2)。

1.文献存贮过程

img2

图1-4-2 文献检索过程原理示意图

文献存贮过程是把纳入检索工具(或系统)的文献赋予检索标识的过程。检索标识有两种,一种是文献外表特征(如标题、著者、来源、文种等),称自然标识;一种是文献内容特征(主题词分类号和类目名称等),指文献论述的主题,称人为标识。赋予检索标识的过程称为标引。为了标识,标引人须对文献的内容进行主题分析,找出能代表文献中心内容的主题概念,然后选用特定的文献检索语言,将主题概念转换成文献内容特征标识,最后将这些文献的特征标识按照一定的顺序进行编排,输入文献检索系统。

2.文献检索过程

首先对检索课题进行主题分析,确定检索概念,然后选择一定的检索语言,将检索概念转换成检索语言的语词(或标识),据此标识到检索工具(或系统)中查找文献线索,最后将该语词(或标识)所标引的文献检索出来。

(二)计算机文献信息检索的原理

计算机信息检索系统由文献信息存储和检索2部分组成。文献信息存储过程,即数据库的建立,是由信息专业人员完成的。他们将分散的文献资料进行收集、整理,对确定收录的文献信息进行著录、标引、编写文摘等工作,把论文转换成若干检索标识输入计算机,组织成具有检索价值的数据结构系统供检索使用。

文献信息检索过程是用户利用数据库检索取得所需文献信息的过程。用户或信息专业人员把情报提问转换成计算机检索系统能够识别的检索式,即规范化(如果是统一语言系统、自然语言检索和全文检索则无须规范化),由计算机进行匹配运算,最后输出检索结果。由于计算机是以字符进行匹配运算,用户必须对文献信息的存储有所了解,尤其是掌握检索标识,才能提高检索效率,发挥计算机信息检索的功能优势。

二、医学文献检索的语言

检索语言是文献检索中用来描述文献特征及表达检索提问的一种专门语言,是检索使用的标识系统,是为文献标引者与检索者之间提供对话的共同语言,便于他们之间的文献信息交流。

(一)一般性检索语言

1.规范化语言(或受控语言)

规范化语言是对文献检索用语的概念加以人工控制和规范,把同义词、同音词、多义词、近义词、同形异义词等进行规范化处理的语言,使每个检索词只能表达一个概念,以便准确检索,防止误检、漏检。如美国《医学索引》的医学主题词表(Medical Subject Heading,MeSH)和我国的《中医药主题词表》都是规范化的检索语言。

2.非规范化语言(或自然语言)

对检索用语的概念不进行规范化处理,而用反映文献实质性内容的词直接作检索词,如关键词。

(二)标识性检索语言

1.外表标识检索语言

外表标识检索语言是描述文献外表特征的检索语言,是依据文献外表特征,如文献名、著者、文献序号等作为文献存贮标识和检索提问出发点而设计的索引语言。主要有:

(1)文献题名索引系统 以文献记载的书名、刊名、篇名等作为标识的字顺索引系统,如引用期刊一览表、篇名索引。

(2)著者索引系统 以文献上署名的著者、译者、编者等作为标识的索引系统,如著者索引(目录)、专利权人索引。

(3)文献序号索引系统 以文献特有的序号作为标识的索引系统,如专利号索引、科技报告号索引、技术标准号索引。

(4)引文索引系统 根据科技文献末尾所附参考文献及引用文献这一外表特征,揭示科学论文之间引证与被引证关系而编制的索引系统,如SCI。

2.内容标识检索语言

内容标识检索语言是描述文献内容特征的检索语言,按其构成原理可分为3种检索语言。

(1)分类检索语言 是将文献所属的学科内容分门别类地系统化组织的一种方法。能较好地体现学科的系统性,揭示知识的平行、隶属和派生关系,便于检索者从学科专业途径查找文献。应用最多的是等级体系分类系统,这是一种直接体现知识分类的等级概念标识系统,它以科学分类为基础,采用概念逻辑分类一般规则而层层划分,构成具有上位类和下位类之间隶属、同位类之间并列的概念等级体系(表1-4-1)。

分类语言的“语词”就是它的类目及相应的分类号,分类号主要用于明确各类目之间的先后顺序。如上例的分类号排序是R、R6、R65、R656、R656.1、R656.2、R656.3……

等级体系分类语言主要用于藏书排架和组织目录体系,也用于其他文献,如期刊论文的分类。国内外有多种著名等级体系分类法,如我国的《中国图书馆分类法》(简称《中图法》)、《中国图书资料分类法》(简称《资料法》)、《国际十进分类法》(简称UDC)等。

(2)主题检索语言 是用主题词来标引和检索文献内容的检索语言。应用较多的有主题词法和关键词法。

①主题词法 主题词(Subject Headings)又称叙词(Descriptor),是来自文献、用户及医学专家并经严格控制,用以表达文献主题或信息需求的单义词或代码。主题词语言是在吸取了多种检索语言优点的基础上形成的一种检索语言,具有较优越的检索功能,适用于计算机化的文献检索,是发展最快、应用最广的检索语言。

表1-4-1 《中国图书资料分类法》(第4版)R类分类等级示意表

img3

采用主题词法编制的索引称为主题索引(Subject Index)。美国《医学主题词表》(MeSH)是使用最多的一种主题检索语言。MeSH用于标引,揭示每一篇文献的主题内容,可提高检索的准确率。

②关键词法 关键词(Key Words)是直接从文献的篇名、摘要和正文中选出具有实质意义并能代表文献主题内容的名词术语。由关键词组成的索引标识系统,称关键词索引。它是一种未经规范化的自然语言,比较适应计算机自动编制索引的需要。出现在文献题录、文摘或全文中的关键词,通常称为文本词(Text Terms),都被纳入索引,提供了更多的检索入口。从某个关键词出发可能查出成千上万篇文献,其中误检率高,必须再通过其他途径修饰检索。

(3)代码检索语言 是以代表事物的代码作为标识系统的检索语言,如美国《化学文摘》(CA)中的化合物分子式索引系统。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈