首页 百科知识 档案标引概述

档案标引概述

时间:2022-10-01 百科知识 版权反馈
【摘要】:档案主题分析,是根据档案标引和检索的需要,依据一定方式,对档案内容进行分析,提取档案主题概念,确定档案主题的类型与结构的过程。主题分析的质量如何,直接关系到档案标引的效果乃至整个档案检索系统的检索效率。

第一节 档案标引概述

一、档案标引的方式

(1) 整体标引

即对一份档案的整体主题用一个标识进行概括式标引。这种标引方式深度较小,常以案卷为单位进行,标引速度快,但不能全面反映档案的主题内容,为浅标引方式。

(2) 全面标引

即对一份案卷或文件的各个局部主题或主题因素分别标引。这种标引方式能比较深入、全面地揭示文件或案卷的各个主题,标引深度大,为深标引方式,但标引工作量也大为增加。

(3) 补充标引

它又称为分析标引,即除了对档案的整体主题进行概括性标引外,还选择具有检索意义的个别局部主题或主题因素作单独标引。这种标引方式标引深度较大,既能概括揭示文献的主要主题,又能揭示较为重要的局部主题,不至遗漏具有检索意义的主题要素,能较为全面深入地反映文献主题,提供较多的检索途径和较好的检索深度。在进行补充标引时,可以案卷标题和卷内文件目录为主要依据,先将案卷的整体主题标引出来,然后根据卷内文件标题(或正文)有选择地补充某些重要的局部主题,达到适度标引的目的。

(4) 对口标引

这又称为重点标引,即选择档案中对本单位服务对象有用的主题进行标引。这种标引具有专业特色,考虑到了专业的特定需要。在标引时,对与专业不太相关的主题可省略,而对与专业相关的主题进行具体标引,专指度高。这种标引方式对文献主题的取舍存在主观性,仅适用于专业性机关和专业档案馆。

在上述4种标引方式中,整体标引和对口标引(重点标引)为浅标引,全面标引为深标引,补充标引深度介于其之间。其中,整体标引不能全面深刻地揭示档案文献的主题,会影响检全率;对口标引的适用范围有限,具有专业对口性;全面标引虽然标引深度大,但标引工作量也很大。相对而言,补充标引方式既能概括揭示文献整体主题,又能揭示具有检索意义的较重要的局部主题,标引深度适度,工作量适中,可保持较快的标引速度,提高检索效率。因此,对于手工标引而言,补充标引在一定程度上优于其他三种标引方式。当然,如果采取的是用自然语言方式进行自由标引和自动标引,就可实现全面标引,尽可能揭示文献的各个主题因素,提高检全率和检准率。

二、档案标引的深度

标引深度是指标引一份档案所用的标识数量。所用的标识少,标引深度就小,称为浅标引;所用的标识多,标引深度就大,称为深标引,标引深度越大,提供的档案途径就越多,文献的利用率也会随之提高。但标引深度并不是没有限制的,因为标引用词过多,必然将一些情报价值不大的内容标引出来,这样反而会影响检索效率。因此,在手工检索系统中标引深度最好在5个以内,计算机检索系统对标引深度没有严格限制。

三、档案标引的程序

(1) 审读文件、案卷,了解档案所论述的内容。主要通过题名来确定档案主题,如果题名不能确切反映文件内容和成分,再查阅正文、文头、文尾和附加标记等,力求准确把握档案的主题。

(2) 进行主题分析,确定主题类型与结构。如果是多主题,一般情况下则需要给出多个分类号主题词,如果是单主题则只需要给出一个分类号。但对于主题标引而言,还需要进一步分析主题结构,对于单主题中的单元主题,一般只需要给出一个主题词;对于单主题中的复合主题,则需要分析各个主题因素,进行组配标引。

(3) 查表,转换主题概念。将档案的主题概念分析出来后,即可从档案分类表和主题词表中选定相应的分类号和主题词进行概念转换,对于多主题的档案应该分解成几个单主题进行标引。在进行分类标引时,转换主题概念实际上是辨别主题所属的类别,寻找并归入恰当的类别。应根据文件、案卷内容的属性、主题多寡、起草意图、利用对象、检索需求等特点,采用恰当的方式和方法,准确、一致、适度地进行标引。遇有难以分类的新事物、新主题的档案材料,分类表上无确切类目可归时,各档案馆(室)可增设新类目予以分类标引,同时上报《中档法》编委会确认。今后若遇到同类主题的文件、案卷亦照此办理,确保一致性。在进行主题标引时,需要辨别主题类型和结构,采用适当的标引方式,将分析出来的主题概念准确地转换成最专指的主题词,或者利用上位词、相关词或组配标引的方式表达主题概念。

(4) 给出档案标识。即根据概念转换的结果,给出相应的分类号或主题词。

(5) 作标引记录。对标引的结果以及标引中所处理的某些问题(如增删主题词等)进行记载,以不断提高标引质量。

(6) 校对审核。主要审核主题分析是否全面、准确,主题概念的转换是否符合标引规则,标引记录有无差错等。

四、档案标引质量评价

评价档案标引质量的标准包括:

(1) 网络度:即标引结果网络文献主题的范围。如果将一份档案的全部主题都标引出来,那么就达到了最高的网络度,但在实际标引过程中往往不可能达到最高的网络度。原因有二:其一,提高网络度可提高检全率,但同时意味着检准率的降低;其二,主题有主次之分,如果对所有的主题都进行标引,那么从某一次要主题入手查找档案,就很有可能检出不太相关的档案。因此,不必对所有的主题都作标引,也就是说,标引的网络度应该适中,应该保持在既有较高的检全率又不太影响检准率的范围内,即要进行适度标引。

(2) 专指度:标引的专指度是指检索标识表达档案内容的确切程度。如果检索标识太泛指,其含义大于档案主题概念,将降低检准率;如果标识的含义小于档案主题,则会影响检全率,造成漏检。

(3) 一致性:标引的一致性是指对主题内容相同的档案标引的结果应该一致,如果对同一主题内容的档案赋予不同的标识,必然会造成该主题档案的分散,影响检索效率。在对同一内容档案的标引中,不同的标引人员所给的标识往往不同,同一人在不同时间的标引结果也往往不一致。因此,标引一致性是在档案标引中急需解决的问题。可采用统一的检索语言进行标引;对组配标引、上位词、相关词标引及增补新词等进行记录,留作以后参考。

五、档案主题分析

档案主题分析,是根据档案标引和检索的需要,依据一定方式,对档案内容进行分析,提取档案主题概念,确定档案主题的类型与结构的过程。它是档案标引的首要步骤,也是档案信息前处理过程中智力消耗较大的阶段,档案主题内容的复杂性与标引人员知识水平的有限性,档案主题内容的客观性与标引人员分析判断的主观性等方面的矛盾使得档案主题分析过程中的误差难以避免,造成档案信息失真现象。主题分析的质量如何,直接关系到档案标引的效果乃至整个档案检索系统的检索效率。因此,须掌握档案主题分析的基本方法,在充分把握档案主题类型及其构成因素的基础上,按照档案检索系统的具体要求,对具有检索意义的档案主题概念进行提炼和取舍,使档案主题分析达到较高水平。

1.档案主题分析的依据

分析档案主题的依据主要为档案题名、文件版头、附加标记乃至正文等,其中档案题名是作者对档案中心内容的概括,一般都能准确反映档案的内容和性质,但也有一些档案题名不能准确表达档案的中心内容,所以题名不能作为档案主题分析的唯一依据,此时就需要查阅文件版头和附加标记。文件版头包括作者、收文机关、文件字号、时间、密级等内容,通过它有助于明确文件的具体内容、使用范围及参考价值等。当从标题、文件版头和附加标记还不能判定档案主题时,就有必要浏览正文。通过翻阅档案正文可以了解其撰写目的、中心内容,从而确定档案论述和研究的主题。

而在实际标引中,在大多数情况下,仅以档案题名为依据基本上就能迅速、准确地判定档案的主题。这主要是由于题名的拟写有比较严格的规定和要求,形成了档案题名规范性的特点。普通档案题名一般由作者、事由、文件(案卷)名称三部分组成,并标明了发文机关名称,其中含有大量可供检索的内容特征和形式特征,基本能反映档案的主题。

2.档案主题分析方法

(1) 对主题类型的分析

所谓主题,是指档案文献所记载和涉及的具体对象与问题,即档案的中心内容。

依主题数量分,档案主题类型分为单主题与多主题两种。只记录或阐述一个事物或一个问题的档案,称单主题档案,如经济作物、档案馆建筑设计等;论述两个或两个以上事物或问题的档案,称多主题档案,如棉花和大豆的种植与销售等。对多主题档案应分解为几个单主题分别进行分析。

依主题的构成因素分,可分为单元主题和复合主题。单元主题是指由一个主题因素构成的主题,如农作物、图书馆等,论述的是一特定的事物对象或问题,分析时只需将该主题概念析出即可;复合主题是指由若干个主题因素结合构成的主题,如大气污染的防治、中国机构改革现状等,对复合主题须深入分析其结构及主题因素之间的相互关系。

依主题的重要程度分,分为主要主题和次要主题。主要主题是在档案主题内容中作者重点论述的主题,也称中心主题;次要主题是在档案论及的几个主题中未加重点论述的主题。在进行主题分析时,应重点分析主要主题,根据标引的需要对其作充分的提炼,而对次要主题,则应根据它的实际标引价值决定取舍。

依对主题表达的明确程度,分为显性主题和隐性主题。显性主题是作者明确阐述的主题;隐性主题是作者未直接加以表达,而是隐含于档案内容之中的主题。对显性主题的分析较为容易,可根据档案题名或正文直接提取主题概念,而隐性主题则易漏标,须在深入了解档案内容的基础上进行分析和提炼。

(2) 对主题结构的分析

主题结构是指构成主题的因素(主题因素)以及这些主题因素在主题中的作用和相互关系。单元主题结构简单,只由一个主题因素构成,而复合主题结构复杂,一般由几个主题因素构成,因此分析主题结构,主要是针对复合主题而言。主题因素分为以下五种:

①主体因素。即文件或案卷中论述的关键性主题概念,是主题中的核心部分。凡具有独立检索意义的主题概念,都可作为主体因素。如《××县人民政府关于加强粮食收购工作的决定》,其中的“粮食收购工作”即为主体因素。

通用因素。即构成主题的通用概念。凡是没有独立检索意义的一些主题概念因素,如研究、方法、设备、总结等,均为通用因素。它们一般不能作检索入口,在主题中主要对主题因素起细分作用,用以补充说明主体因素。如“拖拉机的生产规划”这个主题中,“规划”为通用因素。

③位置因素。即档案所论述的对象所处的空间、地理位置等主题因素,它对主体因素所在的空间、地理位置起限定作用。如“北京市发展乡镇企业情况的报告”,其中“北京市”为位置因素。

④时间因素。即档案所论述的对象所处的时间范围的主题因素。如朝代、年代、年度等,它也对主体因素起限定和修饰作用。如“╳╳省人民政府·1·9·86·年·度工作报告”,其中“1986年”为时间因素。

⑤档案类型因素。即表示档案种类或文件名称的主题概念,如会议记录、指示、通知、报告、通报、命令等。上述五种主题因素的组配次序如下:主题因素—通用因素—位置因素—时间因素—档案类型因素。不同档案主题所包含的主题因素多少不同,应根据标引深度的要求选择应该标引的主题概念。例如“中国七五期间工业经济体制改革研究报告”包含了上述五种因素,如果标引深度为3的话,那么只能选择“工业经济—经济体制改革—研究”进行组配标引。档案主题概念,除主体因素不能省略外,其他因素都可根据要求在标引中略去不标。

确定主题结构的过程,也就是对复合主题进行概念的分解的过程。

(3) 对主题因素间相互关系的分析。主题因素之间的相互关系主要有下面几种:

①限定关系。表示事物与事物的某一属性及方面,如“汽车的保养”。

②交叉关系。表示具有概念相交关系的同级事物或对象,如“水生哺乳动物”。

③应用关系。表示某种科学、原理、方法、材料、设备、工艺等在某方面的应用,如“激光技术在医学中的应用”。

④影响关系。表示某事物对另一事物的影响,如“环境污染对生物的影响”。

因果关系。表示某事物是另一事物的原因或结果,如“大气污染的危害”。

⑥比较关系。表示两个或两个以上主题因素之间的比较,如“国有经济与个体经济”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈