首页 百科知识 文献信息检索语言

文献信息检索语言

时间:2022-08-26 百科知识 版权反馈
【摘要】:信息检索语言是适应信息检索的需要,并为信息检索特设的专门语言。信息检索语言也称标引语言、索引语言等,是人与检索系统对话的基础,它使文献的标引者和检索者取得共同理解,从而实现检索。检索语言的使用是检索技能的一个重要方面。主题语言是直接以代表文献内容主题概念的标识作为检索标识,并按其字顺组织起来的一种检索语言。

2.3 文献信息检索语言

2.3.1 检索语言的定义

信息语言(Retrieval Language),是指用于描述信息系统中信息的外表特征、内容特征及表达用户信息提问的一种专门语言。信息检索语言是适应信息检索的需要,并为信息检索特设的专门语言。信息检索语言也称标引语言、索引语言等,是人与检索系统对话的基础,它使文献的标引者和检索者取得共同理解,从而实现检索。检索语言的使用是检索技能的一个重要方面。

2.3.2 检索语言的类型

检索语言可划分为不同的类型:按文献的有关特征可划分为内容特征语言和外表特征语言;按构成原理可划分为分类语言和主题语言;按适用范围可划分为综合性语言、专业性语言和多学科语言;按标识形式可分为先组式语言和后组式语言等几种类型。其中分类语言和主题语言是最常用的检索语言。

图2-1 检索语言类型

2.3.2.1 分类语言

分类语言是按学科范畴和知识之间的相互关系列出类目,并用数字、英文字母对类目进行标识的一种检索语言。它集中反映学科之间的系统性及学科与学科之间的相关、从属、派生关系。这种检索语言体系是从大类到小类,从总体到局部,层层展开形成分类体系的。它由类目号码及名称构成分类类目表,在情报检索中作为检索语言。分类语言可分为等级体系分类语言和组配分类语言,目前最普通使用的是等级体系分类语言。

我国目前常用的分类语言主要有《中国图书馆图书分类法》(简称《中图法》)、《中国科学院图书馆图书分类法》(简称《科图法》)、《中国人民大学图书馆分类法》(简称《人大法》)等,国外常用的分类语言有《杜威十进分类法》、《国际十进分类法》和《美国国会图书馆分类法》等。

(1)《中国图书馆图书分类法》简称《中图法》,是由政府部门编制的一部大型综合性图书分类法,1973年完成初稿,1975年由科学技术文献出版社正式出版,此后不断修订,1999年3月第四版正式出版,《中图法》是目前我国图书馆和情报单位普遍使用的一部综合性分类法。

《中图法》分有5个部类和22个大类。

img2

img3

《中图法》的标记符号采用拉丁字母与阿拉伯数字相结合的混合号码制。其中拉丁字母表示大类,其他各级类目用阿拉伯数字表示。“T工业技术”类的二级类目太多,也采用字母表示。例“TB9”,T代表一级类目——工业技术,B代表二级类目——一般工业技术,9代表三级类目——计量学。《中图法》基本采用层累制作为编号制度。

例:

[大类]F经济

[二级类]F0政治经济学

     F1世界各国经济概况、经济史、经济地理

     F2经济计划与管理

[三级类]F20国民经济管理

     F21经济计划

     F22经济计算、经济数学方法

     F23会计

[四级类]F239审计

     F24劳动经济

     F25物质经济

     F27企业经济

     F28基本建设经济

     F29城市与市政经济

(2)《中国科学院图书馆图书分类法》简称《科图法》,是中国科学院图书馆1954年编制的,到1994年已对版本修订了三次,《科图法》分为5大部类,下分25个大类,还有6个附表、1个索引,所有大类号均用两位数表示。《科图法》影响很大,其编制既适合大型综合性图书馆,又能适应专业性图书馆使用,其自然科学部分类目较为详细,系统性强,具有较强的科学性

《中国科学院图书馆图书分类法》(主表示例)

00马克思列宁主义、毛泽东思想

10哲学

20社会科学

50自然科学(总论)

71工程技术

90综合性图书

(3)《中国人民大学图书馆图书分类法》简称《人大法》,1953年第一版,到1996年已经出版第六版,《人大法》是新中国成立后第一部科学性、实用性较强的图书分类法,当时以社会科学见长。分类法由4大部分、17个大类、9个复分表和2个附表组成。类目标识完全采用阿拉伯数字,一个数字代表一个类号,用1~17的数码表示17个基本大类;对两位一类的数码标识在号码数字后加小圆点;对全部类目等级列举次第展开,反映类目之间的种属和并列关系。

《中国人民大学图书馆图书分类法》(第六版主表示例)

1马克思列宁主义毛泽东著作

2哲学

3社会科学、政治

4经济

5军事

6法律

7文化  教育  科学  体育

8艺术

9语言、文字

10文学

11历史

12地理

13自然科学

14医药、卫生

15工程技术

16农业科学技术

17综合性科学、综合性图书

(4)国外主要分类法以《杜威十进分类法》和《美国国会图书馆图书分类法》最为著名。《杜威十进分类法》(Dewey Decimal Classification),简称《杜威法》或《DC法》,是目前国外使用较为广泛、较有影响的图书分类法,由美国图书馆学家麦威尔·杜威1876年创制,目前已被翻译成30多种语言,并有大约130多个国家使用这一分类体系。杜威法是根据培根关于知识分类体系的倒排,采用十进制的等级分类体系,即把所有学科分成9大类,分别标100~900的数字,9大类表示9个专门的主题范畴。各类中的类目均按照从一般到特殊,从总论到具体的组织原则,以下逐次分类,形成一个层层展开的等级体系。《杜威十进分类法》发表后,先后有许多国家的学者以此为根据编制了多种分类法,其中以《国际十进分类法》影响最大。

《杜威十进制分类法》主要类目

000 总论

100 哲学

200 宗教

300 社会科学

400 语言学

500 纯粹科学

600 技术科学

700 美术

800 文学

900 地理与历史

《美国国会图书馆图书分类法》(Library of Congress Classification)简称《国会法》或《LC分类法》,是目前美国大多数图书馆采用的分类方法。《国会法》是世界上最大型的列举式分类法,其类目设置与次序并无严格的科学系统,未细致照顾学科之间的亲疏远近、并列从属等关系,而是以本馆藏书实际情况为依据,由各门类有关专家就自己领域逐类列类,众多不同类被安排为便于使用的次序。《国会法》分为21个大类,分别由A到Z的21个字母构成,采用拉丁字母与阿拉伯数字组成的混合号码为标记,字母表示基本大类和二级类,多为传统学科和知识门类,子目用数字为标记,从1~9999,类目标记具有弹性,可无限延展,至小数点以后,各大类均有详细索引及专用的复分表。

《美国国会图书馆图书分类法》主要类目

A  总类:著作集

B  哲学、宗教

C  历史相关科学

D  历史:世界史

E~F 历史:美洲史

G  地理、人类学

H  社会科学

J  政治

K  法律

L  教育

M  音乐

N  美术

P  语言、文学

Q  科学

R  医学

S  农业及其他

T  工业技术

U  军事科学

V  海军兵学

Z  目录学及图书馆科学

2.3.2.2 主题语言

主题语言是直接以代表文献内容主题概念的标识作为检索标识,并按其字顺组织起来的一种检索语言。它打破了按学科分类的方法,使分散在各个学科领域里的有关课题的信息按字顺集中于同一主题,使用时就如同查字典一样按字顺找到所需的主题词,在该词下,列出反映该主题内容的有关信息。根据词语的选词原则、组配方式、规范方法,主题语言可分为标题词语言、关键词语言、单元词语言和叙词语言。

标题词语言是以标题词(规范的事物名称、名词术语)作为文献内容标识和检索依据的一种主题词语言,是最早出现的一种按主题来标引和检索文献的传统检索语言。标题词语言是来自自然语言中比较定型事物的名称,并经过规范化处理的能表达文献主题内容的词、词组或短语。标题词按字顺排列,词间语义关系用参照系统显示,以标题词表的形式体现。如美国工程信息公司编制的《工程主题词表》(Subject Headings of Engineering,简称SHE)。

关键词语言是直接从原文的标题、摘要或全文中抽选出来,具有实质意义的、未经规范化处理的自然语言词汇,是作为信息存贮和检索依据的一种检索语言。关键词不受词表限制,表达事物概念直接、准确,能及时反映新事物、新概念,目前关键词语言已被广泛地运用于手工检索和计算机检索系统中。如美国《化学文摘》(Chemical Abstracts,简称CA)的关键词索引。

单元词语言。单元词是一种最基本的、不能再分的单元词语,亦称元词,它也是从文献内容中抽出,并经过规范化处理,代表一个独立的概念。单元词具有灵活的组配功能,在检索时可以将某些单元词组配起来代表某一特定概念,因此这种语言属于后组式主题语言。

叙词语言是主题语言的最高级形式,其基本成分是叙词。叙词是从文献内容中抽选出来的、从概念上不可再分的基本概念的单元词汇。检索时利用这些表达概念单元的叙词进行组配,以表达一个复杂的概念。叙词语言适用于计算机检索和手工检索,是目前应用较广的一种语言。如英国《科学文摘》(Science Abstracts,简称SA)、《EI》(1993年后)等均采用叙词语言。叙词语言是一种规范化、后组式的主题语言。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈