首页 百科知识 档案目录数据库建设

档案目录数据库建设

时间:2022-10-22 百科知识 版权反馈
【摘要】:档案目录数据库中的记录又称为“档案机读目录”或“档案电子目录”,是存储在计算机内,使用某种数据库管理系统组织管理档案目录的数据集合。为此,档案目录数据库的结构设计包括两项内容。档案文件的著录标引和著录信息录入,是档案目录数据库建立的重要工作和档案信息化的关键环节,意义十分重大,需要给予高度重视。二是数据质量问题会给档案信息系统埋下隐患。
档案目录数据库建设_档案信息化建设

档案目录数据库中的记录又称为“档案机读目录”或“档案电子目录”,是存储在计算机内,使用某种数据库管理系统组织管理档案目录的数据集合。

(一)档案目录数据库的结构设计

根据著录对象的层次不同,档案目录数据库分为案卷级目录数据库和文件级目录数据库两类。为实现计算机检索,必须将反映档案内容特征和形式特征的案卷级著录信息和文件级著录信息输入计算机数据库,由计算机系统通过专门的数据库管理系统和档案管理软件对其进行采集、加工、整理和检索。

数据库管理系统是存储、管理档案目录信息的最佳工具,它按照一定的数据模型,将相互联系的结构化信息以特定的方式组织存储起来,构成数据集合。为此,档案目录数据库的结构设计包括两项内容。

1.选择档案著录项目

《档案著录规则》(DA/T 18-1999)规定了档案进行著录的项目和形式。该标准规定的著录项目共分7项,每项分若干著录单元(小项)。在列举的22个著录小项中,只有正题名、责任者、时间项、分类号、档号、电子文档号、缩微号、主题词或关键词8项为必要项目,其余为选择项目,这意味着不同的档案目录数据库在项目选择上可能存在较大差别。

事实上,《档案著录规则》(DA/T 18-1999)主要用于规范传统档案目录的著录标引工作,对电子档案目录的检索和网络共享考虑不够充分。因此,目前在构建档案目录数据库时常常增加一些新的著录项目。例如,为便于解决数据访问权限的控制问题,增加“主办部门”和“协办部门”项目;为便于调阅数字化的档案全文,增加“全文标识”项目;为解决跨地区、跨层次数据共享,增加“组织机构代码”等。另外,2001年1月实施的《归档文件整理规则》也对档案目录数据库著录项目的确定带来了较大影响,采用新规则形成的文件目录数据库在结构上与此前的文件目录数据库有所不同,许多地方传统文件与电子文件分别规定了不同的库结构。

2.确定著录项目的数据格式

具体规定每个著录项目(记录字段)的数据类型和字段长度。数据库管理系统所管理的数据对象是结构化的,因此必须事先确定好档案目录数据库各字段的名称、字段类型、代码体系和约束条件等。表3-4即文件级档案目录数据库结构示例[资料来源于江苏省地方标准《文书档案文件级目录关键数据库结构与数据交换格式》(DB32/505-2002)],只有结构一致、格式规范的目录数据才能集成管理、并库共享。

表3-4 文件级档案目录数据库结构的示例

(续表)

注:Char为定长字符型,VarChar为可变长字符型,Int为整型。

(二)档案文件的著录标引和著录信息录入

档案文件的著录标引和著录信息录入,是档案目录数据库建立的重要工作和档案信息化的关键环节,意义十分重大,需要给予高度重视。从形式上看“著录”和“录入”是两项工作,而在档案信息系统的操作中往往结合起来,交叉进行,即一面著录标引,一面录入数据。为了提高档案著录、数据录入的速度和质量,须从以下三个方面采取对策:

1.提高认识,增强操作人员的责任心

档案著录和数据录入工作的重要意义在于:一是大规模、高质量的档案目录数据是实现档案信息化价值的前提。信息行业有一句行话:“三分靠硬件,七分靠软件,十二分靠数据”,没有实力强大的数据库,再先进的档案信息系统也只能是空中楼阁,形同虚设。二是数据质量问题会给档案信息系统埋下隐患。信息行业还有一句行话:“计算机系统输入的是垃圾,输出的也必然是垃圾,绝不会成为宝贝”。一旦输入了数据垃圾,计算机软硬件技术难以自动消除之。档案数据库质量控制有“技防”和“人防”两种,其中人防,即提高人的责任心和操作技能永远是第一位的。因此,要从培养操作人员的素质抓起,落实工作职责和考核办法,实现对档案文件的著录标引和著录信息录入工作的精细化管理。

2.严格按照国家规范设计数据库结构

档案信息化建设单位应当严格按照《档案著录规则》《档案分类标引规则》《档案主题标引规则》《中国档案分类法》《中国档案主题词表》等国家相关标准规范,结合实际,制定本行业、本专业、本单位标准和规范,为档案数据库建设提供标准支持。要维护标准和规范的权威性,在档案信息系统开发,特别是数据库结构设计时应严格执行相关标准和规范,防止数据库设计的盲目性和随意性,确保档案数据的一致性、准确性和规范性。

3.采取有效的技术手段提高数据录入的速度和质量

档案文件的著录标引和录入工作十分枯燥,不但效率低,而且容易引起操作疲劳而出错。为此,应当在加强“人防”的同时,尽量采用“技防”。事实上,计算机技术的发展已经为提高数据录入的速度和质量准备了充分的手段。

(1)在数据库建设中控制数据结构定义。为了提高系统的适用性和可扩展性,很多档案信息系统都为用户提供了灵活的数据库自定义功能,然而这项功能如不加以控制就会造成“乱定义”,即定义的随意性。为此,在设计档案信息系统自定义功能时,应当将数据库的表字段设计分为“必选项”和“可选项”。必选项严格按照《档案著录规则》设置,不允许自定义,可选项可在规范引导下进行自定义。

(2)利用计算机智能,自动录入数据。在录入档案数据时,某些档案著录项可以通过计算机自动处理后录入数据,如自动生成档号、序号、部门号、库位号;根据文件级著录的文件页数、文件日期,自动生成案卷级文件页数、起止日期;根据文件的归档类目号,自动生成分类号;根据文件标题或文件内容,自动标引主题词等。自动录入的数据能够避免人为录入差错,大量节约人力,并显著提高录入的速度。

(3)使用代码录入。代码是确保著录信息和档案特征一致的有效手段。如组织机构名称,有全称或简称,简称往往又很不规范,这会造成检索时的混乱,而应用代码,可以做到代码和组织机构的严格对应,检索时就不会出现漏检或误检。因此,档案信息系统应设计简便的代码管理功能,包括代码的维护、录入提示等,确保规范使用代码,又快又好地录入档案著录信息。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈