首页 理论教育 关键词属于规范化检索语言

关键词属于规范化检索语言

时间:2022-04-12 理论教育 版权反馈
【摘要】:各种情报检索语言的基本原理是一致的。因此,可以认为它是情报检索语言的一种特殊类型。情报检索语言按其包括的学科或专业范围,可分为综合性语言和专业性语言;按其适用范围,可分为一种检索工具或检索系统专用的语言,某一类型图书馆或情报机构专用的语言,各类型图书馆和情报机构通用的语言,以及国际通用的语言。叙词可采用词组形式,以提高其在反映概念上的准确性,体现了检索语言的发展趋势。

各种情报检索语言的基本原理是一致的。但是,在表达各种概念及其相互关系时和在解决对它们提出的共同要求时所采用的方法不同,因而形成了不同的类型和语种。

情报检索语言按其构成原理,可分为分类检索语言、主题检索语言和代码检索语言三大类型。此外,还有一种引证关系追溯法,按其作用来看,也可以说是情报检索语言的一种。

分类检索语言用分类号来表达各种概念,将各种概念按学科性质进行分类和排列。分类检索语言包括等级体系型分类检索语言(体系分类法)和分析-综合型分类检索语言(组配分类法)。它们统称分类法系统。体系分类法主要应用概念划分与概括的方法,组配分类法主要应用概念分析与综合的方法。事实上,无论是前者还是后者,都既采用概念划分与概括的方法,建立等级体系结构,又采用概念分析与综合的方法,实行组配。

主题检索语言用语词来表达各种概念,将各种概念按字顺排列。主题检索语言包括标题词型主题检索语言(标题法)、单元词型主题检索语言(单元词法)、叙词型主题检索语言(叙词法)和关键词型主题检索语言(关键词法)等。它们统称为主题法系统。标题法的检索标识是在编表时就固定组配好,即所谓“先组式”的;单元词法和叙词法的检索标识一般是在检索时才组配起来,即所谓“后组式”的。标题法、单元词法和叙词法都要对取自自然语言的语词加以规范化,而关键词法一般认为是直接使用自然语言不加规范,其实它也要进行某种程度的规范化处理。标题法、单元词法和叙词法在表达各种概念及其相互关系的方法上各有特点,但许多方法是相互通用的。所以,要在它们之间划一个明确的界限是比较困难的。

事实上,分类法系统和主题法系统也相互渗透,各种方法互相采用。例如,叙词法就采用了多种检索语言的方法。

代码检索语言一般只就事物的某一方面特征,用某种代码系统来加以标引和排列。例如,化合物的分子式索引系统,环状化合物的环系索引系统。

引证关系追溯法即引文索引法,是显示科学论文之间相互引证而形成的论文网的一种方法。这种方法提供了从被引论文来检索引用它的全部论文的途径,从而能顺着一种思想发展过程的线索找到有关的情报。因此,可以认为它是情报检索语言的一种特殊类型。

情报检索语言按其包括的学科或专业范围,可分为综合性语言和专业性语言;按其适用范围,可分为一种检索工具或检索系统专用的语言,某一类型图书馆或情报机构专用的语言,各类型图书馆和情报机构通用的语言,以及国际通用的语言。有些检索语言,则专门适用于某一类型的文献资料(如专利分类法)。此外,还可分为传统检索工具适用的语言和机器检索系统适用的语言。

由于检索语言都是利用各种通用文字来表达概念的,所以有单语种语言和多语种语言之分。单语种语言又可按自然语言的语种细分,因为它们还会带有各种自然语言的某些特点。

检索语言按其标识的组合使用方法,还可分为先组式语言(文献标识在编表时就固定组配好)和后组式语言(文献标识在检索时才组配起来)。后组式语言也可当作先组式语言使用(文献标识在标引时组配成固定的标识串),即所谓先组散组式。

上述五种划分检索语言类型的角度中,按构成原理分是最基本的,按标识的组合使用方法分也很重要,这是决定检索语言性能的两个重要因素。

(一)体系分类语言

体系分类语言也称等级体系分类法。它是一种直接体现知识分类的等级概念标识系统,以科学分类为基础,结合文献的特点,采用概念逻辑分类一般规则层层划分,构成具有上位类和下位类之间隶属、同位类之间并列的概念等级体系。例如:

       R 5 内科学

        R51 传染病

        R52 结核病

        R 53 寄生虫病

         R531 原虫病

         R532 蠕虫

          .1 线虫病

          .2 吸虫病

          .3 绦虫病和囊虫病

          ……

分类语言的“语词”就是它的类目及相应的分类号,分类号主要用于明确各类目之间的先后顺序。如上例中分类号的顺序是R5,R51,R52,R53,R531,R532,R532.1,R532.2,R532.3……

体系分类语言主要用于藏书排架和组织目录体系,也用于其他文献(如期刊论文)的分类。国内外有多种广泛使用的著名等级体系分类法,例如我国的《中国图书馆分类法》、美国《国会图书馆分类法》(LC)等。

使用体系分类法编制的常用检索工具有:《中文科技资料目录》、《外文科技资料目录》、荷兰《医学文摘》(EM)、美国《生物学文摘》(BA)等。

(二)主题语言

主题检索语言即主题法,是用语词作为概念标识,将概念标识进行字顺排列,并用参照系统等方法间接显示概念之间的相互关系的检索语言体系。按概念标识出现的先后顺序,分为标题词语言、单元词语言、叙词语言和关键词语言。目前应用较多的是叙词法和关键词法。

1.标题词语言 标题词(heafding)语言是一种先组式(pre-coordination)规范语言,词之间的关系早已有词表规范表达,词表按字顺编排,也有参照指向,实现相关概念的连接。标题词除了单级标题外,还采用大量多级标题,有通用的和专用的两种。标题词作标目的索引有标题词索引,如《工程索引》(EI)1993年前的检索刊是非常典型的一种主要利用标题词来检索的工具。

2.单元词语言 单元词(uniterm)语言是规范语言,元词是一种最基本的、不能再进一步分割的词汇单位,单元词也称元词,它能独立表达某一概念。元词语言是后组式语言(post-coordination),它将一些元词在检索执行时组合起来使用。比如“科技”和“文献”分别表达两个独立的概念,它们组合成“科技文献”即形成了一个新的复合概念。元词强调单元化词的组配,仅限字面组配。单元词表比较简单,简单的单元词表只有一个字顺表,较完备的单元词表则由一个字顺词表和一个分类词表组成。单元词字顺表包括全部单元词和大量非单元词,非单元词列在单元词条目下,或有参照指向。单元词检索具有灵活、自由的组配方式。

3.叙词语言 叙词语言也是一种后组式语言,是为克服元词与标题词的缺陷而产生的一种较新、使用较多的检索语言。叙词语言的基本成分是叙词(descriptor)。叙词又称主题词,具有严格的同义规范、词义规范、词类规范及词形规范。叙词和元词相同,也有组配性,但它的组配是概念组配而不是字面组配。叙词可采用词组形式,以提高其在反映概念上的准确性,体现了检索语言的发展趋势。

叙词语言的主要特点:①采用的词语有较严格的“规范”,主要是对一个概念的同义词、近义词及拼法变异词等适当归并,以保证词语与概念的唯一对应;②采用参照系统将某些非主题词指向采用的主题词以及显示相关主题词间的意义相关关系;③采用类似分类的方法编制主题词分类索引(范畴表)和等级索引(树状结构),采用类似关键词法编制主题词轮排索引,以从多方面显示词间关系并便于查找主题词;④以上内容和规则构成一部主题词表,其中的主题词还随着科学的发展及文献中用词的变化而不断有增删修订定期更新。

4.关键词语言 关键词(keyword)语言是适应目录索引编制过程自动化的需要而产生的。所谓关键词,是指那些出现在文献的题目、摘要乃至正文部分,对表征文献主题内容具有实质意义的语词。关键词法是指将文献中作者所使用的、能描述其主题概念的那些具有关键性的词抽出,一般不进行规范化处理,按字顺排列,以提供检索途径的方法。关键词语言具有如下优点:①关键词运用的科技术语都是技术人员习惯使用且易接受的自然语言。②大大节省了检索系统的存储时间,缩短了检索工具出版的时差,加快了信息传递速度。③现代科技的发展,新概念和新名称不断出现。关键词语言能很好地适应这种发展,及时报道新的信息资料。

关键词索引大体可分为两类:一类是带上下文的关键词索引,包括题内关键词(KWIC)索引、题外关键词(KWOC)索引、双重关键词索引;另一类是不带上下文的关键词索引,包括单纯关键词索引、词对式关键词索引和简单关键词索引。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈