首页 百科知识 作用和类型

作用和类型

时间:2022-09-30 百科知识 版权反馈
【摘要】:信息检索的基本原理之一是匹配。由此可见,检索语言在信息存储和信息检索全过程中起到了十分重要的作用,它是标引人员和检索人员共同使用的语言工具,是沟通文献标引和文献检索的桥梁,也是影响检索效率的关键因素之一。在科学研究领域,追踪一条被引的参考文献展开搜索已经成为一种常规的信息检索方法,引文索引法的应用能够促进科研人员创造性地获取情报,从而推动研究的创新与发现。

第一节 检索语言的特点、作用和类型

检索语言是人们在标引和检索过程中所使用的一种人工语言。所谓人工语言,是人们根据预先规定的规则对自然语言进行挑选、规范、编制而成的,而自然语言则是人们在日常生活中进行口头或书面交流所使用的语言,是约定俗成的。

一、检索语言的特点

检索语言与自然语言相比,具有如下特点:

1.单义性

语词与概念一一对应,排除了自然语言中同义词、多义词和词义含糊的现象。例如:

精神(心理学)精神(哲学)

通过括号内的限定词将词义进行注释,排除了多义现象。

2.规范性

检索语言采用确切、规范、通行的语词作标识,而不采用不通行的同义词、近义词、译名、俗称、旧称、不能准确表达全称含义的简称作标识。例如:

番茄(俗称) 莱塞(旧译名) 伤科(旧称)

 用 西红柿  用 激光器   用 正骨科

3.关联性

检索语言中采用了各种手段来表达概念之间的相互关系。

4.系统性

检索语言的标识都按一定方式进行了系统排列。分类法按号码顺序排列,主题法按字顺排列,系统排列能固定标识的位置,使之有序化,从而提高检索速度。例如:

CB 司法+    DuiWaizhengce

1 律师           对外政策    [EA]

11 组织           D  外交政策

111 机构的设置管理     F  闭关政策

1111 国内机构设置管理    S  政策

1112 外国律师在华机构管理  C  和平共处五项原则

…………

(摘自《中国档案分类法》)  (摘自《中国档案主题词表》)

5.简明性

检索语言对大量的自然语言词汇进行了压缩和精选,只选取文献标引和检索所需要的词汇作标识,具有简明性。

检索语言与一般的词典不同,词典虽然也表达概念并进行了系统排列,但没有明确显示概念之间的相互关系。

与自然语言相似,检索语言也有自己的词汇和语法。检索语言的词汇是指表达档案文献主题概念、登录在分类表、词表、代码表中的全部标识,一个标识(分类号、主题词、代码)即为检索语言的一个语词,由这些标识系统编排而成的分类表、词表、代码表即为检索语言的词典。语法则是创造和运用这些标识所需要的一整套规则。

二、检索语言的作用

检索语言的主要作用是作为概念转换的依据。在进行信息存储和信息检索的过程中,以同一检索语言为依据,对文献中分析出来的主题概念和从检索提问中分析出来的主题概念进行标引,转换成检索标识,从而使标引用词和检索用词相匹配,使信息检索全过程得以完成。具体体现在:在信息存储时,文献标引人员首先对文献进行主题分析,提炼出能够准确、全面表达文献内容的主题概念,并对照检索语言,用检索语言的语词(标识)把这些主题概念标示出来,然后录入检索系统;在信息检索时,检索人员也需要首先对检索课题进行主题分析,提炼出相应的能全面、准确反映检索意图的主题概念,并对照同一检索语言,将这些主题概念转换成检索标识,然后再从检索系统中查找用该检索标识标引的文献,从而找到含有所需情报的文献。

信息检索的基本原理之一是匹配。即对表达文献主题内容的概念标识与表达检索者情报需求的概念标识进行相符性比较,如果二者一致,则意味着文献的内容符合情报检索需求,该文献即被检出。要实现这样的匹配,必须有一个前提条件,即在文献标引和文献检索过程中使用同一种检索语言,而且对同样的主题概念使用相同的标引用词(检索标识),这样才能使相符性比较获得成功,达到较好的检索效果。由此可见,检索语言在信息存储和信息检索全过程中起到了十分重要的作用,它是标引人员和检索人员共同使用的语言工具,是沟通文献标引和文献检索的桥梁,也是影响检索效率的关键因素之一。

三、检索语言的类型

1.按构成原理分

检索语言按构成原理可分为三大类型:分类检索语言、主题检索语言和代码检索语言。

(1) 分类检索语言

分类检索语言以分类号作为标识,表达各种概念,按照学科性质对各种概念进行分类,并按分类号的顺序进行系统排列。包括等级列举式分类法、分面组配式分类法和列举—组配式分类法三种,统称为分类法系统。等级列举式分类法主要采用的是概念划分与概括的方法,分面组配式分类法主要采用的是概念分析与综合的方法。列举一组配式分类法则是上述两种方式的结合,是广泛采用各种组配方式的方法。

(2) 主题检索语言

主题检索语言用语词来表达各种概念,将各种概念按照主题词的字顺进行排列。它包括标题法、单元词法和叙词法,统称为主题法系统。

(3) 代码语言

代码语言一般就事物的某一方面特征,用某种代码系统加以标引和排列,如化合物的分子式索引系统等。

此外,还有引证关系追溯法(引文索引法)这样一种特殊的检索语言,它是显示科学论文之间相互引证关系的一种方法。通过引文索引,科研人员可以从一篇被引论文追溯检索引用它的全部文献,了解论文之间的相互关联,从而掌握某一学科领域某一学术观点、研究课题、研究方法的发展过程。在科学研究领域,追踪一条被引的参考文献展开搜索已经成为一种常规的信息检索方法,引文索引法的应用能够促进科研人员创造性地获取情报,从而推动研究的创新与发现。

2.按标识的组合方式分

检索语言按标识的组合方式可分为:先组式的检索语言和后组式的检索语言。先组式检索语言的特点是文献标识在编表时就固定组配好,后组式检索语言的特点是文献标识在检索时才组配起来。

3.按所包括的学科和专业范围分

检索语言按学科、专业可分为综合性语言、多学科语言和专业性语言。

4.按所采用的语言分

检索语言按采用的语言可分为单语种语言和多语种语言。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈