首页 理论教育 电子文件元数据

电子文件元数据

时间:2022-03-04 理论教育 版权反馈
【摘要】:电子文件元数据是保障电子文件真实性、完整性、有效性的技术关键,一直就是电子文件研究的热点。金更达等认为,电子文件元数据标准的制定不可随意而为,一个科学的电子文件元数据设计框架是指导、规范电子文件元数据设计的关键。对此政府部门的理由是国内电子公文归档元数据没有统一,档案行政管理部门提出需采集的元数据过多、不便于办公,弥补这一缺陷所要的付出的代价太高。

2.7 电子文件元数据

电子文件元数据是保障电子文件真实性、完整性、有效性的技术关键,一直就是电子文件研究的热点。不过,近几年对电子文件元数据的研究已不仅仅是强调元数据的重要性,也不再是笼统地介绍元数据的概念、性质、层次划分等,而更多地是希望建立整体性、系统性较强的电子文件元数据规范、标准或方案以及元数据的质量管理与控制,等等,这些研究旨在构建一个符合实际工作需要的元数据采集范围、流程和规范,更好地解决电子文件归档管理的诸多问题。

2.7.1 元数据需求分析

电子文件管理元数据需求分析必须遵循一定的原则。张茜认为,进行需求分析时应当遵循全面、系统、客观的原则,运用演绎法、归纳法、分析法、综合法及功能结构法等方法,经过形成需求陈述、提炼元数据、形成需求体系三个步骤,最终达到明确电子文件管理过程中不同应用角度、层次、用户、流程的需求并形成完整、准确地描述电子文件管理元数据的需求以及达到系统化的需求体系的目的(84)

张正强提出分析电子文件管理元数据需求有两类方法:演绎法与归纳法。基于演绎法的有文献保证法,代表项目是在美国专家戴维·比尔曼(David Bearman)主持下进行的匹茲堡大学的元数据研究项目,即文件管理中凭证性功能要求项目(简称BAC项目),以及理论推演法,代表项目是在Luciana Duranti教授领导下进行的加拿大不列颠哥伦比亚大学研究项目,即电子文件完整性保存项目(简称UBC项目)和澳大利亚元数据研究项目产业、研究与教育战略合作项目(简称SPIRT Project);基于归纳法的有用户访谈法,典型项目是InterPARES项目,以及流程分析法。他认为,在电子文件管理元数据的需求分析中,孤立地、单一地运用某一种方法都不是最佳的,需要综合地运用各种方法来分析需求,这样才可能更全面、更客观地反映电子文件的需求。因此他提出了电子文件管理元数据需求分析的保证原则,即文献保证原则、理论保证原则、用户保证原则、流程保证原则和机构保证原则(85)

2.7.2 元数据设计结构

金更达等认为,电子文件元数据标准的制定不可随意而为,一个科学的电子文件元数据设计框架是指导、规范电子文件元数据设计的关键。这样一个设计框架应当遵循元数据功能描述、相应的设计原则、以文件运动理论为核心的基础理论、元数据信息来源UML建模、元数据信息模型、元数据模块化元素定义、语义和语法定义以及元数据应用等(86)。之前他和何嘉荪合作,对该元数据设计框架进行了深入的分析与说明(87)(88)(89)

电子文件管理元数据的基本结构可以分为宏观、中观和微观三个层次。电子文件管理元数据的宏观框架结构就是指电子文件管理元数据的顶层结构,主要解决的是一个电子文件管理元数据含有多少个元数据类组及这些元数据类组相互之间的关系;中观类组结构就是指电子文件管理的中层结构,主要解决的是一个类组含有多少个元数据元素及这些元素相互之间的关系;微观元素结构就是指电子文件管理系统的底层结构,主要解决的是一个元素或元素值含有哪些语义类别和语义成分,以及这些语义类别和语义成分相互之间的关系。这样一个电子文件管理元数据系统结构可以作为电子文件管理元数据标准化的模型,作为设计电子文件管理系统中预设元数据的依据,以及作为分析电子文件管理元数据的功能方案(90)

张弛提出电子文件管理元数据宏观结构多维分面化架构的概念,指在架构电子文件管理元数据的宏观结构时,利用分面的方法,将电子文件划分成多个分面,各个分面内的元数据元素可互相进行组配,从而形成满足各种需求的电子文件管理元数据。相对于单一线型化的架构方式存在数据冗余、体系庞大、专指度低等缺陷,多维分面化架构有明显的优势(91)。他还提出电子文件管理元数据微观结构分面化的概念,就是将表征电子文件某一方面属性的一组元素或元数据值结构化,从而使其形成一组元数据元素或元数据值构成部分的分面,即形成电子文件管理元数据微观结构的分面的过程。同时,还对电子文件管理元数据元素的分面化、元数据元素亚面的分面化以及元数据值的分面化做了解释和评述,指出分面微观结构使得电子文件管理元数据在元素与元数据值两个方面都能灵活地运用,能更加多维全面地揭示电子文件的属性,能更加充分高效地保证电子文件的真实性、可靠性、完整性和可利用性(92)

2.7.3 元数据方案建议

刘家真等从构建办公自动化系统的管理元数据方案角度出发,分析了我国电子文件管理系统元数据以及电子文档管理元数据,在此基础上提出了我国办公自动化系统元数据方案设计的思考。他们认为,要保障被管理的电子文件真实、可靠和持续可用,就必须在整个办公自动化系统中对电子文档与电子文件实行整体化管理,文件管理元数据是支持重要电子文档保留证据价值、便于归档文件真实完整与维持长期可用的系统管理工具之一。他们将2008年国家档案局发布的《电子文件元数据标准》和《文书电子文件元数据方案》两项行业标准的征求意见稿与ISO23081《信息与文献——文件管理流程—文件元数据—原则》中规定的文件管理元数据必须具备的六种元数据进行比较,认为这两项征求意见稿在概念模型设计上是基本一致的。同时,他们对我国办公自动化系统的元数据方案提出如下建议:①办公自动化系统的元数据格式应当规范化;②国家应当发布办公自动化系统通用管理元数据标准;③注意电子文档管理元数据与电子文件管理元数据的关联与区别;④办公自动化元数据方案制定应具有可执行性(93)

目前国内已经结题的元数据标准体系有《基于XML的电子文件管理元数据标准》提出的127项元数据和《电子文件元数据标准》提出的130余条可供电子文件归档捕获的元数据项。面对这些已经成型的或尚在讨论中的电子文件元数据标准、方案,刘家真等人认为,我国大多数电子公文管理系统是没有嵌入确保文件价值的元数据的。对此政府部门的理由是国内电子公文归档元数据没有统一,档案行政管理部门提出需采集的元数据过多、不便于办公,弥补这一缺陷所要的付出的代价太高。档案管理部门则认为,电子公文归档管理不是政府部门的主要任务,因此被边缘化;同时档案行政管理部门又只能在电子公文管理软件上提出参考意见,起不了主导作用。要解决这些问题则需要通过宏观管理策略来协调电子公文形成与归档管理的相关利益人,保证元数据在电子文件生成阶段就是真实、完整、可靠的,而不能仅局限于某一个行业、学科或部门内而不考虑其他相关影响因素(94)

2.7.4 元数据的功能

电子文件各项具体功能可以概括为四大宏观功能,即电子文件元数据在控制电子文件的背景、内容、结构、管理中所起到的描述功能、发现功能、管理功能以及长期保存功能(95)

张正强列举了7个不同版本的电子文件管理元数据功能划分,提出电子文件管理元数据功能的划分是从不同维度即行为、能力和功效维度认识的结果。而这三个维度的功能又是密不可分的:从作用上看,行为功能、能力功能与功效功能是处在基础功能、核心功能与导向功能的关系链上,后一项都是前一项的概括与抽象;从层次上看,行为功能、能力功能与功效功能是处在微观功能、中观功能与宏观功能的关系链上,后一项是对前一项的控制(96)

刘越男提出,如果在电子文件管理软件中以一种系统的、连续的、结构化的、标准化的方式设计、捕获、组织和管理元数据,那么元数据就可以产生以下的作用:全面描述电子文件、保障电子文件的长期真实性、保护电子文件的完整性、保证电子文件的可读性、支持电子文件信息的组织和查询、支持电子文件管理的全程控制以及支持电子文件管理流程的集成与优化(97)

2.7.5 元数据质量与控制

刘家真等将关注点落在了元数据的质量管理与控制上,因为电子文件管理元数据质量直接关系到被描述的文件,同时也与元数据自身的利用价值有关。电子文件管理元数据的质量是指元数据在表达需要说明的对象时,能够达到准确性、一致性与完整性的程度。它需要满足质量描述程度、描述精度、数据现时性的要求,也还需要达到一般元数据的质量共性要求。在质量管理与控制方面,要做到建立合理的电子文件管理元数据方案、加强元数据的捕获和安全控制以及要动态地维护元数据的真实、完整与安全,包括确保元数据文件自身安全、时时与电子文件保持关联。其质量管理策略是:①严格管理制度;②作为重要文件加以维护;③确定与电子文件持续关联的存储方式,嵌入或者单独存储;④元数据封装与固化以保持原貌(98)

2.7.6 题名元数据

张正强等以题名元数据为对象进行了深入研究。他们首先指出了通用元数据中题名元素的最基本功能也是它的核心功能就是有助于确认资源(即确认功能),在语义结构上没有更多的细分即没有再列出下位子元素。图书情报元数据的题名元素在此基础上增加了一项功能,即检索功能,在语义结构上一般是由“题名”与“交替题名”构成,“交替题名”在语义上是对“题名”的限定,是“题名”的下位子元素。而电子文件管理元数据中题名元素则是要有描述功能、真实性功能和背景信息功能,在语义结构上有两种扩展结果,一是扩展“副题名”、“自拟题名”和“简称题名”这3个下位子元素,二是扩展出实现题名元素第三项特定功能的元素限定词,即“题名命名规则”。在国家的层面上,全面约束匹配原则,即尽量选取多种结构以全面保证实现题名元数据功能的原则,应用于功能与语义结构的匹配是更加适合的(99)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈