首页 理论教育 信息标引的基本概念,标语言及信息标引的类型的介绍

信息标引的基本概念,标语言及信息标引的类型的介绍

时间:2022-11-04 理论教育 版权反馈
【摘要】:依标识的规范和受控程度,标引语言可分为受控语言和自然语言。信息标引的类型信息标引的类型取决于表达文献内容的标引语言的种类,因此信息标引主要分为分类标引和主题标引两种类型。习惯上,分类标引被称为分类。由于主题标引是直接给文献主题概念命名,因此,无论是对不同类型的文献进行主题标引,还是用不同种类的主题语言进行主题标引,其原理和方法差异不大。

5.3.1 信息标引

(1)标引的基本概念

信息标引,是指分析信息对象的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,作为信息存储和检索依据的处理过程。它是在对文献信息对象分析基础上发展起来的,故又称为文献标引。

信息标引过程一般包括两个环节:一是主题分析,即在了解和确定文献的内容属性及帮助揭示内容的某些外表属性(如文献类型)之后,将这些属性概括为主题并用自然语言表述,同时分析主题概念之间或主题概念因素之间的结构关系;二是转换标识,即用专门的主题概念或概念因素,构成一定形式的检索标识。简言之,信息标引就是用特定检索标识揭示文献内容。信息标引是建立信息检索系统的基础和前提,文献或信息只有经过标引,获得检索标识之后,才能按检索标识加以组织,转化为有序的集合,使得从内容特征进行检索成为可能。

标引语言是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统,是根据标引和检索需要而编制的人工语言。从用途来讲,标引语言又称检索语言、索引语言,相对于自然语言来说,标引语言又称受控语言、规范语言。

从语言学的角度来看,标引语言与自然语言和其他人工语言一样,有自己的词汇和语法。标引语言的词汇是指用于表达主题概念的全部标识,它往往由相应的分类表、词表、代码表登录或规定。标引语言的一个标识就是它的一个语词。登录和展示标识的分类表、词表、代码表则是标引语言的词典。例如,《中国图书馆分类法》、《中国档案分类法》、《汉语主题词表》、《中国档案主题词表》等都是相应的标引语言词典。标引语言的语法是指构造和使用标识,以正确表达主题概念的一整套规则。标引语言的各种标识(语词)都有其特定的构造规则。

(2)标引语言

标引语言是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统,是根据标引和检索需要而编制的一种专用语言或标识系统。从用途来讲,当这种语言应用于标引和索引编制工作时,称为标引语言;当应用于信息检索工作时,又称检索语言、索引语言。它是标引者与检索者、人与检索系统之间交流信息的工具。

按照信息组织的思想方法,信息标引所用的标引语言主要可分为分类语言和主题语言。

分类语言,是用分类号表达主题概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。以学科、专业为中心的系统性是其主要特点。分类语言可细分为体系分类语言、组配分类语言、体系—组配分类语言。

主题语言,是一种由受控的自然语言语词直接表达主题概念,按语词字顺排列主题概念,主要用参照显示概念之间关系的标引语言。以事物为中心的直接性是其主要特点。主题语言可进一步划分为标题语言、单元词语言、叙词语言、关键词语言。

依标识组合时间的先后,标引语言还可分为先组式语言、后组式语言、散组式语言。先组式语言是指标识在编表时(标引前)就已组合好,标引和检索时不必或较少进行组配的标引语言,如主题法中的标题法就属于这种类型。后组式语言是指标识主要供组配使用,而且标引时不将标识组配在一起,到检索时才将标识组配起来的标引语言,如主题法中的单元词法、叙词法就属于这种类型。散组式语言是指标识主要供组配使用,而且标引时就要将表达主题概念的若干个标识组配在一起的标引语言。

依标识的规范和受控程度,标引语言可分为受控语言和自然语言。受控语言(controlled language)指信息组织的标识词汇以及信息检索的索引词汇在使用前经过优选和规范化处理,并且整个语言经常处于某权威机构或检索系统的管理之下。这种语言又称为规范化语言,与自然语言相对。如主题法中的标题语言、单元词语言、叙词语言、体系分类语言等均属于受控语言。自然语言(natural language)指标引词汇和索引词汇直接来自所处理的文献本身,使用前未经优选和规范化处理,与受控语言相对。如主题法中的关键词语言就属于这种类型。

(3)信息标引的类型

信息标引的类型取决于表达文献内容的标引语言的种类,因此信息标引主要分为分类标引和主题标引两种类型。

分类标引,是指对文献进行主题分析,用特定的分类语言表达分析出的主题,赋予文献分类检索标识(分类号)的过程。习惯上,分类标引被称为分类。这是因为,分类标引实质上就是对文献进行分类。

文献分类,是指根据文献内容及其他相关属性,以分类语言(分类法)为工具,分门别类地系统揭示和组织文献的过程和方法。对文献整体来说,经过分类,可将内容属性相同的文献用相同的分类检索标识予以聚集,将内容属性相关的文献通过分类检索标识予以反映,而内容属性不同的文献则用不同的分类号予以区分。这样就可以形成一个揭示和组织文献的严密系统。对文献个体而言,分类就是归类,即根据文献的内容属性将它归入特定分类体系的适当类目,赋予相应的分类号。

主题标引,是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(标题词、叙词等)的过程。由于主题标引是直接给文献主题概念命名,因此,无论是对不同类型的文献进行主题标引,还是用不同种类的主题语言进行主题标引,其原理和方法差异不大。

如按照标引标识组合时间的先后,信息标引还可分为先组式标引、后组式标引、散组式标引;按标引标识的受控程度,信息标引还可分为受控标引和自然语言标引。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈