首页 理论教育 数字信息长期保存的相关问题研究进展

数字信息长期保存的相关问题研究进展

时间:2022-03-04 理论教育 版权反馈
【摘要】:Malcolm Todd认为数字信息资源长期保存是要“保证被捕获的正确的信息能长期获取;保证地方档案馆所保存的数字信息的安全性;确保不断制定、发展新政策和新计划;促进未来包括再利用的信息管理”。长期保存数字信息的核心问题只有两个,一是保证承载信息的数字比特流的存在且可以有效读出。在众多的非技术因素中,更多的研究关注数字资源长期保存的成本因素、知识产权管理、保存主体育标准化问题等。

数字信息长期保存的相关问题研究进展

刘家真 刘 莉

(武汉大学信息管理学院)

【摘 要】该文以2000年后至今的文献为依据,追踪了数字信息长期保存的非技术因素的研究与讨论,并对近十年来数字信息资源长期保存的政策与法律法规、保存数字资源的各种合作方式以及国内外与数字资源保存相关的其他实践进行了述评。

【关键词】数字资源 长期保存 非技术因素 法律法规 合作方式 实践探索

On the Study of Digital Preservation

Liu Jiazhen Liu Li

(School of Information Management,Wuhan University)

【Abstract】Based on the study of the literature since 2000,this paper gives a summary of the research on non-technical factors of digital preservation,and presents an overview of the policies,laws and regulations on digital preservation,the cooperation patterns of digital resources preservation,and other practices at home and abroad related to digital preservation in the last ten years.

【Keywords】digital resources long-term preservation nontechnical factors laws and regulations cooperation patterns practices

目前国内对保存数字资源(digital preservation)主要有几种代表性观点:第一种观点基于保存目的对数字信息保存做出定义,“通过制定保存计划,进行资源分配,采用必要的保存方法和技术,从而保证数字信息的持续检索和利用”;第二种观点从确保数字文献的使用寿命,包括其长期可读取性的角度,对数字信息保存进行界定;第三种观点认为数字信息长期保存是指在数字信息寿命的时间内,“信息可以完整准确地从媒体内读出,并可被理解”。还有人认为,数字信息长期保存需要满足3个基本目标,即①可读性,即可以检索、理解和使用等;②持久性,即保存时间的永久性;③真实性,即内容完整与可信。(1)

2009年6月,英国数字档案馆咨询主管Malcolm Todd,在数字信息资源长期保存路演中,将数字资源长期保存定义为:“通过改变技术环境,来保证组织需要的数字信息真实性及其可获取性的一系列活动。”

Malcolm Todd认为数字信息资源长期保存是要“保证被捕获的正确的信息能长期获取;保证地方档案馆所保存的数字信息的安全性;确保不断制定、发展新政策和新计划;促进未来包括再利用的信息管理”。(2)英国国家档案馆在数字保存中强调数字连续性(digital continuity),并将其定义为:随着时间的推移和变化,根据需要使用数字信息资源的能力。英国国家档案馆于2007年开始数字连续性项目,目的在于在所有中央政府部门的资助下,开发一项所有的公共部门都能用的,用来理解和管理数字连续性的服务。这一服务将包括导航和一个由工具、服务和咨询组成的框架。导航和框架将于2010年夏初步完成,而这一服务将于2011年初完全嵌入国家档案馆(3)。英国国家图书馆将数字资源存取划分为长期保存(long-term preservation)、中期保存(medium-term preservation)和短期保存(short-term preservation),其中长期保存定义为:对数字资源的连续获取,或至少这些数字资源无限期地包含着这些信息。美国研究图书馆组织则将其定义为保存数字资源可长期维护和其内容可长期获取的必要管理活动。这几种定义虽然在表述上有所不同,但其内涵趋于一致,即长期存储和长期获取(4)

无论如何描述,保存数字资源的目的是明确的,即“我们想做的一切就是保护我们认为今后还需要的知识的完整和安全”(5)。长期保存数字信息的核心问题只有两个,一是保证承载信息的数字比特流的存在且可以有效读出。比特流的存在是根本,有了它就可以采取各种技术方法来恢复信息,这使得人们都将保存数字信息看成是一种技术活动。随着相关研究的不断深入,近十年来人们更多地研究了影响数字信息长期保存的非技术因素,并从管理模式、政策与制度、标准化等方面展开了更多地研究。

1 影响数字信息长期保存的非技术因素研究

我国数字信息资源保存研究开始于20世纪90年代后期,经过不到10年的努力,逐步认识到,要确保数字信息资源长期保存,技术因素是重要的,但不是唯一的,更多的非技术因素制约了技术的努力,如成本问题、管理问题、法律问题,知识产权问题等(6)。国内还有人将非技术因素归纳为组织因素(包括成本费用、专业性、组织机构、角色分工、有选择保存和责任划分);法律因素;标准因素;意外因素(7)

在众多的非技术因素中,更多的研究关注数字资源长期保存的成本因素、知识产权管理、保存主体育标准化问题等。

1.1 成本因素

国内对保存数字资源的成本分析上,多以定性地分析为主,而国外相关问题的研究更多地基于成本计算与分析。例如,国内有作者通过图1,勾画出长期保存数字资源的成本因素分析。

img105

图1 数字资源保存的成本

20世纪,国外就展开了数字资源长期保存的成本分析,并与保存纸质文献进行了比较分析。国外的Testbed项目对数字资源长期保存所涉及的成本问题进行了分析,提出了成本指标,设计了一个有关数字资源保存的成本。2003年,瑞典国家档案馆对数字信息长期保存的费用进行过分析并设计了保存数字资源的费用评估模型,发现尽管不同的国家国情不同,保存数字资源的费用不完全一致,但保存数字资源的费用评估模型却具有很强的相关性并且能够使用该模型去计算其他环境下产生的费用(8)。2004年瑞典国家图书馆对数字资源长期保存的成本研究指出,如果按照技术、员工和设备场所3类来分析电子文件的保存成本,就会发现劳动力成本大约占到总费用的39%(9)

微软公司海湾地区研究中心的研究指出“华尔街的人们说管理存储文件的费用是每年每TB为300 000美元。平均每1 000GB就需要超过一名的数据管理员。其他公司表示每10TB就需要一名数据管理员,而Google和网络档案馆每100TB需要一名数据管理员。备份/存储、归档、重新组织、发展和管理容量等费用远远大于图片的保存费用。这对数据的保存真是一个挑战:每PB的存储就需要1 000名存储管理员(10)。”

2009年3月,剑桥大学图书馆参与了一项由联合信息系统委员会(JISC)资助的“保证研究性数据的安全2”(Keeping Research Data Safe 2)项目,通过识别长寿命数据集,以便进行成本分析(11)

1.2 知识产权问题

开放档案信息系统参考模型(Reference Model for an Open A rchive Information System,OAIS)认为,如果我们将长期保存权定义为图书馆对特定数字资源进行收集保存、管理并在一定条件下提供服务的权利的话,那么OAIS所提出的每个环节的行为都涉及相应的知识产权问题,可以相应地归纳为存档权、存储管理权和服务权,需要在计划过程和管理机制中通过相应的法律、技术和管理措施予以保障(12)

从知识产权管理的角度,长期保存过程中首先要解决的是,图书馆是否获得对数字资源进行收集、复制和长期保存的权利,即所谓长期保存中的存档权(13)

在国外,研究数字资源长期保存中的知识产权问题较为有影响的项目有英国“AHRB计划”(A rts and Humanities Research Board,AHRB)、澳大利亚国家图书馆的在线出版物的法定缴存本研究以及英国高等教育基金委员会下属的联合信息系统委员会(JISC)资助的“雪松计划”(Cedars Project)。这三项研究的聚焦点在:将传统版权法中的合理使用制度扩展到数字信息的长期保存领域;加强与版权人的协作来解决相关知识产权问题;扩充法定缴存本制度,保证电子出版物的长期保存(14)

1.3 数字信息资源长期保存的主体及责任体系

我国学者认为,数字信息长期保存的相关主体涉及数字信息创制者、出版商、数字信息保存机构、软硬件的开发者、非营利组织和政府部门等,他们在数字资源保存中分别扮演不同角色与承担不同责任(15)

美国、澳大利亚等国家的学者普遍认为,个人对其自己形成的数字信息有保存的义务和责任,如果个人不愿承担责任或者无能力承担责任,可以委托档案馆、图书馆等承担这项责任或以失效保险机制(fail safemechanism)等方式来承担责任。若个人不愿承担责任,也不委托档案馆、图书馆等承担那么责任应由专门成立的数字档案馆承担,但是个人要受到处罚。(16)

我国学者按照长期保存数字信息的角色分工,提出了以下责任建议,见表1。

表1 数字信息长期保存的责任者及其责任(17)

img106

1.4 数字信息资源长期保存的标准化问题

标准是数字信息资源长期保存系统建设过程中不可忽视的重要元素之一,是保证数字信息资源长期保存各环节互操作的基础,贯穿于数字资源生命周期的全过程。从系统实现角度分析,数字信息资源长期保存系统的标准可分为系统层次的标准、业务逻辑层次的标准和数据层次的标准。其中系统层次的标准包括数字信息资源长期保存系统标准、系统互操作标准;业务层次的标准包括摄入过程的标准、存储过程的标准、访问过程的标准和管理过程的标准;数据层次的标准包括信息模型、文件格式标准、数据转换标准、数据编码标准、数据标识标准和元数据标准等。(18)

标准在数字信息资源长期保存中的重要性得到了人们的广泛认可。然而,使用标准也使长期保存的相关问题变得更为复杂。“eLib StandardsGuidelines”研究了长期保存中标准使用存在的相关问题,认为标准化存在以下4个方面的问题:①可能同时使用多个标准,但是相互之间并不兼容;②标准提供者会根据需要在标准执行过程中增加新的内容;③一些标准在软件执行过程中可能有很大的差别;④一些标准的实际内容要远大于实际使用,因此,在不同的应用中会有不同的子集(19)。Jeff Rotheenberg对标准是数字信息资源长期保存的解决方案的观点提出了质疑,他指出“将数字文档转换成标准的形式,然后在需要时可以迁移到新的标准,可能是真正的长期保存解决方案提出前的一个过渡方案(20)”。

围绕以上问题,近十年来在数字信息长期保存的管理实践上取得长足的发展,相关的科学研究成果丰硕,其主要体现在保障数字资源长期保存可执行的法规与政策的出台,跨行业、跨组织与跨国的保存数字资源的合作项目于团体增多,长期保存数字资源的行动已经由理论研究走向了实践。

2 数字信息资源长期保存的政策与法律法规

数字资源长期保存政策是人们为实现数字资源长期保存目标而制定的方针、原则、策略和措施,是有效实施数字资源长期保存管理的保证。数字信息保存政策能够促进社会对信息保存的理解、提高数字信息长期保存的效率、加快保存工作顺利开展。(21)

我国的数字信息长期保存工作正处于起步阶段,国家层面的政策制定和规划尚待出台。国际上的相关政策有:

联合国教科文组织(UNESCO)于2003年颁布了《数字遗产保护宪章》,其第6条(制定策略和政策)指出:“应根据紧迫程度、当地的情况、现有的方法和未来的打算等因素,制定出保存数字遗产的策略和政策”。其第8条(保护数字遗产)指出:“为了保护数字遗产,会员国需有必要的法律和体制框架。作为国家遗产保护政策的一项主要内容,档案立法和图书馆、档案馆、博物馆及其他公共存放处的法定存放或自愿存放都应包括数字遗产”。(22)

2000年12月,美国国会指定由国会图书馆负责数字信息资源长期保存国家计划,并通过立法建立了国家数字信息基础和保存项目(National Digital Information Infrastructure and Preservation Program,NDIIPP)。该计划决定让国会图书馆承担领导全国数字信息资源长期保存的责任,并与政府部门和拥有收集与保存数字内容专长的实体进行合作,此外它还鼓励广大民营机构参与此项计划(23)

2010年3月17日,美国第111届国会的提案H.R.1387在美国众议院获得通过,H.R.1387即《电子信息保存法案》(Electronic MessagePreservation Act),该法案的目的在于对《美国法典》第44编进行修订,满足联邦政府的某些电子文件的管理要求,满足认证和报告总统相关文件的需要。

《电子信息保存法案》第二章要求美国的档案管理人员公布与保存作为联邦文件的电子记录相关的规章,并对这类规章进行定期的审查和必要的修改。该法案要求这类规章:①依据《联邦记录法案》(FederalRecords Act)对这类电子文件的捕获、管理和保存作出规定;②要求这类电子文件能够通过电子搜索检索;③制定一个电子文件管理系统强制性的最低功能要求,并确定一个能保证联邦机构遵守这些要求的方法;④包含联邦机构必须遵守的时间表;⑤包含关于对其他电子文件进行捕获、管理和保存的要求。要求机构和档案保管人员对机构遵守有关规章的情况进行报告。

法案第三章要求档案管理人员:①在总统的任期,制定总统文件的管理标准,包括电子信息捕获、管理、保存和保证电子信息可通过电子搜索检索获取所必须的文件管理控制;②确保每年制定的文件管理控制都符合《总统记录法案》(Presidential RecordsAct)的要求;③每年向指定的国会委员会报告相关情况。要求档案管理人员想国会报告:①归档保存的总统文件的数量及格式;②总统的文件管理控制是否符合本法案及《总统记录法案》(Presidential RecordsAct)的要求。

该法案第四章要求档案管理人员制定内部章程,以防止对美国国家档案文件管理局(National A rchives and Records Administration,NARA)机密文件的非法删除,对这类文件的损毁或破坏,以及未经授权对这类文件的访问。要求这些章程:①禁止NARA人员外的任何人,在没有NARA人员或视频监控的情况下,在任何不安全的房间访问机密文件,禁止任何拥有个人通信设备的人员进行任何文件查阅;②要求所有查阅机密文件的人员,同意根据他们的文件查询申请对其物品进行搜查;③要求机密文件查阅过程的所有记录都由NARA保留。(24)(25)

此外,基于国家图书馆法案(National Library Act,1960),澳大利亚的潘多拉项目(Preserving and Accessing Networked Documentary Resources of Australia,PANDORA)建立了针对保存澳大利亚网络资源的政策,采用合作的方式收集或创建在线数字信息,这种合作既可以分担经费又可以促进保存技术的研发(26)

3 数字信息资源的合作保存

数字信息资源数量巨大、类型繁多、保存技术复杂以及网络的跨地域性和保存过程中涉及多方面权益等问题,需要图书馆之间、图书馆与其他社会团体和社会组织之间的紧密合作。采取多方合作的模式,有利于开展数字信息资源的长期保存,这已成为国际上的共识。澳大利亚、荷兰、德国、日本、法国、加拿大等也纷纷开展了数字信息资源的合作保存的研究。他们的研究不仅在理论上有了重要的突破,而且还进行许多实验项目,并取得了一些阶段性的成就。(27)

今天,保存数字资源的国际合作项目与跨国机构较为普遍,近十年来发布的较为有影响的研究成果的跨国合作项目有:

(1)CAM iLEON项目

CAM iLEON(Creative A rchiving atM ichigan&Leeds)项目是美国密歇根大学和英国利兹大学联合开展的数字资源长期保存项目,其研究资金来自于美国国家科学基金会与英国联合信息系统委员会(JISC),项目完成时间为1999—2003年。CAM iLEON研究的主要领域包括:软件寿命、仿真、迁移、用户评价和数字保存的成本核算。CAM iLEON已经完成的研究报告有:数字保存策略指南、数字保存战略的费用、数字馆藏管理指南等(28)

(2)NEBLIB

NEBLIB为网络化欧洲寄存图书馆的缩写(Networked European Deposit Library),它是由荷兰国家图书馆牵头,联合八个欧洲图书馆与三家出版社、两个信息科技机构及一所国家档案馆组成的联盟,其目的是构架电子出版物的欧洲寄存系统,探讨数字保存的技术问题。

2000年NEBLIB邀请专家在巴黎讨论数字保存问题,以OAIS模型为基础,开发出“资料层模型”概念,列出了8个项目、38个子项目的保存后设资料(29)。2000年4月,NEBLIB确认并发布了几种可靠的数字保存战略,包括记录的档案格式、数字信息的迁移与转换以及硬件技术模拟等(30)

除跨国合作展开数字资源保存研究外,一些发达国家在国内也以多方合作的模式展开数字保存的研究与实践。例如,澳大利亚图书馆联合了7个州级图书馆形成了保存本国网站资源的国家分布式保存网络。又如美国国会图书馆联合主要的国家机构、在保存数字信息方面有经验的团体与私有机构等构成了保存本国数字信息资源的基础结构与基本框架。该合作机构的成员,已经不再仅是保存机构(如图书馆、档案馆等),而是由多种职业背景的团体与个人构成。(31)英国在长期保存数字资源封面做了一系列工作,除参与国际项目外,在本土也展开了较多有影响的多方合作研究与保存工作。如:

(1)Cedars计划

从1998年4月开始,在英国高等教育基金会信息系统委员会的资助下,由剑桥大学、里茨大学、牛津大学联合主持的为期三年的Cedars计划开始运作。1998年6月,项目组以OAIS模型作为基础架构建立了示范性的数字档案馆。2002年结题时,项目组发布了保存元数据指南。(32)

(2)英国的数字保存联盟(DPC)

2001年,英国组建了数字保存联盟(Digital Preservation Coalition,DPC)。该联盟由15个正式成员机构与14个准成员机构组成。15个正式成员机构为:大英图书馆,剑桥大学图书馆,国家与大学图书馆联盟,博物馆、图书馆和档案馆理事会,数字保存中心,联合信息系统联盟,国家档案馆,苏格兰国家档案馆,苏格兰国家图书馆,开放大学,北爱尔兰公共记录办公室,出版商授权理事会,牛津大学,英国研究理事会,伦敦大学电脑中心等。14个准成员机构是:艺术与人文数据服务,英国广播公司,数字图书馆研究中心,伦敦金融城联盟,威尔士国家图书馆,自然历史博物馆,联机计算机图书馆中心,牛津大学考古学,波蒂科档案馆,英国档案工作者协会,都柏林Trinity学院图书馆,英国数字档案馆,南安普顿大学,议会档案馆等(33)

数字保存联盟的目的在于共同应对英国数字资源安全保存的挑战,以及加强国际合作以保护全球数字记忆和知识基础。作为一个非营利性组织,DPC提供一个所有成员共同努力实现长期获取的机制。DPC的目标是在支持其成员保证数据的长期获取和管理过程中起到催化剂作用;加强与英国国内和国际伙伴的合作以推进数字信息保存和资产管理议程;并在成员之间知识传递过程中起到经纪人和代理人的作用。目前该联盟正在运作的2009—2010年的战略计划包括以下五个方面:领导、影响和合作;共享和传播知识;丰富成员的实践;发展并授权给成员的工作人员;确保联盟的持续性和有效性。(34)

(3)数字保存中心(DCC)

数字保存中心(Digital Curation Centre,DCC)是4个机构的联盟,包括3所大学与一个研究委员会。数字保存中心是英国领先的有关数字信息保存领域专门知识的中心。任何有义务存储、管理和保护数字信息的人,都可以向DCC寻求专家意见和切实的帮助。

许多研究小组已经了解到数字信息长期保存的意义,但目前为止,能在工作中实际、有效地解决数字信息长期保存问题的还不多。作为英国这一领域领先的技术中心,DCC致力于通过和高等教育部门一起,分享他们的知识和经验,来弥补这一不足。除专家意见之外,DCC还提供技术解决方案、保存工具和学习资源,以帮助数字信息保管人员锻炼数字保存的能力(35)

由上可见,国外数字资源合作保存已经非常成熟。目前我国也参与了数字资源长期保存的某些国际合作项目,如①中德数字资源长期保存实践研究项目。②参与LOCKSS项目。(36)

4 国内外相关实践与研究

4.1 国内相关实践与研究

与国外相比,尽管我国起步较晚,但近十年来在数字资源长期保存方面做了不少的研究与实践,特别是参与了不少国际上的相关研究。其主要有:

(1)国家图书馆“网络信息资源保存实验项目”

“网络信息资源保存实验项目”(Web Information Collection and Preservation,W ICP),是由我国国家图书馆网络信息资源收集与保存科研课题组于2003年1月开始展开的系统研究。在不到半年的时间内,国家图书馆搭建网络文献收集与保存试验环境,并正式开始网络信息资源的采集与保存。2003年年底,“网络信息资源保存试验项目”网站开通并提供服务。(37)

5年后,国家图书馆根据《政府信息公开条例》率先着手采集与保存分散在各大政府网站的政府公开信息,并整合后提供公众利用。2008年11月,国家图书馆和北京拓尔思信息技术股份有限公司(简称TRS)正式达成协议,利用TRS在垂直搜索技术方面的优势,自动抓取各级政府网站上的公开信息。收集的基础信息主要包括三个方面:①政府信息主要收录各政府网站上政府信息公开栏目中的信息,到目前为止,信息量已超过40万条;②政府公报栏目收录了国务院公报,国务院组成部委公报,部分省、市人民政府公报30余种;③政府机构栏目收录了中央和地方的政府机构3 000余个(38)。2009年4月30日,由国家图书馆(简称国图)和北京拓尔思信息技术股份有限公司(简称TRS)共同建设的“中国政府公开信息整合服务平台”正式开通(39)

(2)中国Web信息博物馆

中国Web信息博物馆(Web InfoMall)是在国家“973”和“985”项目支持下,由北京大学网络实验室开发建设的中国网页历史信息存储与展示系统。

该博物馆的目的是保存在中国本土产生的重要网页,为社会提供多种海量网络信息产品。目前,中国Web信息博物馆以平均每月一千万网页的速度扩大规模地进行采集与保存。它是一项社会公益事业,所提供的信息产品均免费。目前,共有自2001年以来30亿网页可供在线检索(40)

(3)参与国际项目研究

自2004年7月“中欧数字资源长期保存国际研讨会”在中国国家科学图书馆成功召开以来,中国国家科学图书馆围绕着数字长期保存领域参与了多项国际合作研究,如数字资源持久保存国际合作试验项目(CSDL项目),数字化科技信息资源长期保存体系与政策机制(NSDL项目)。(41)

中国科学院文献情报中心、清华大学、香港中文大学、香港大学、香港理工大学等机构加入了LOCKSS联盟。中国科学院文献情报中心已经与LOCKSS有了较好的合作,参与了LOCKSS插件、中文期刊插件技术的开发(42)

4.2 国外相关实践与研究

从1994年起,美国、欧洲、澳大利亚等国家的一些图书馆、档案馆等机构开展了数字资源保存的研究项目(43)

4.2.1 美国

近十年来,美国较有影响的数字资源保存项目主要有以下。

美国主要是由国家图书馆、国家档案馆、大学图书馆等机构开展研究,较有影响的有(44)

美国国家数字信息基础设施与保存计划(National Digital Information Infrastructure and Preservation Program,NDIIPP),该计划自2000年12月开始,决定对美国的Web信息、数字视频、数字音频、数字期刊、电子图书和数字电视等的数字资源进行保存,其中Web信息资源的整理和保存被视为该计划的重要组成部分。2003年初,美国国会通过了对NDIIPP的实施计划。

美国数字化藏品保存项目(Persistent A rchives and E lectronic RecordsManagement,PAERM),它是美国国家档案管理局和美国圣地亚哥超级计算机中心的合作项目,试图通过迁移将数字资源保存到新的技术平台上,并希望借此研究与实验能将电子资源至少保存400年。

互联网档案馆(InternetA rchive)是位于旧金山的一个非盈利基金会。自1996年以来,InternA rchive与亚马逊公司下属的A lexa公司密切合作,一直按月收集与保存HTML网页,以便研究人员、历史学家和学者能够永久地访问。A lexa公司负责从网上收集数据,在数据失去商业价值的6个月后再捐赠给Internet资源库保存,并由其向所有的用户开放。

多备份资源保存项目(Lots of Copies Keeps Stuff Safe,LOCKSS)。受美国国家自然基金、Sun M icrosystems Inc以及Andrew W.Mellon基金支持,由美国Stanford大学图书馆发起并组织实施的LOCKSS项目,致力于解决电子期刊的永久保存与利用问题,它通过建立出版商与图书馆、图书馆与图书馆之间的协作平台,提出了从电子资源出版、发布到永久性保存与利用等一整套解决方案(45)。LOCKSS项目由于可以解决各类电子学术期刊和博客内容的采集与保存,一旦资源供应商无法提供相关服务时,LOCKSS的缓存或已储存的备份数据就会立刻提供资源服务,确保了用户对资源的长期访问(46)。由此,该项目得到越来越多的数字资源供应商与图书馆的支持。该项目联盟由起初的80多个图书馆,发展到今天已有20多个国家的157家机构在使用LOCKSS的BOXES软件,8个供应商已经加入LOCKSS联盟或正积极准备将他们的期刊加入该项目(47)

4.2.2 澳大利亚

早在1996年,澳大利亚国家图书馆就制定了《澳大利亚电子出版物的国家策略》并展开了PANDORA项目(Preserving and Accessing Networked Documentary Resources ofAustralia)研究,其目的是制定保存澳大利亚电子资源的政策和操作程序。目前该项目由该馆的电子资源部、编目部、期刊部等部门共同管理,并以电子资源部为主,澳大利亚国家图书馆每年大约花费100万澳元支撑该项目。到2004年12月15日,该项目已收集了7 404个标题,两亿多个文件(48)

澳大利亚国家档案馆在数字文件长期保存方面取得的最新进展是,创建了数字文件长期保存的软件平台,一些州政府及以下地方政府部门成为测试该保存软件的机构(49)

4.2.3 欧洲

欧洲在数字资源长期保存上展开过大量的研究与实践,并取得了较为丰硕的成果。其主要研究与实践有:

(1)欧洲国家版本图书馆网络第二期项目

欧洲国家版本图书馆网络项目(Networked European Deposit Library,NEDLIB),第一期项目于2001年完成后,建立了欧洲版本图书馆网络的基础结构,保证电子出版物的长期保存和利用。为了解决生成结构的标准和接口、电子文献技术数据、查询控制、资源库维护程序等,在欧洲委员会资助下,自2001年开始了ERPA2NET项目研究。该项目由英国、荷兰、意大利和瑞士的学术性机构合作进行,以建立一个保存文化遗产和科学数字对象领域的虚拟数据交换中心和知识存储库。(50)

(2)数字档案实例研究

由英国信息系统联合委员会(JISC)资助,英国大学图书馆主持的数字档案实例研究项目(CURL Exemplars in Digital A rchives,CEDARS),于1998—2002年进行。其研究成果是确定了数字资源长期保存的战略框架和具体方法,并建立了一个分布式的长期存储系统。(51)

(3)ERPAENT项目

ERPAENT是欧洲共同体为保存数字文化遗产和科技信息而启动的跨国研究项目,于2001—2004年进行。项目的主要合作者为荷兰国家档案馆、意大利国家和瑞士联邦档案馆、英国格拉斯哥大学的艺术与人文资料服务中心等。其主要特色是建立了一个可以扩展并能自我维持的欧洲启动项目,成为关于数字保存的知识交换中心和知识仓库,使机构与个人能够实现知识转移。(52)

(4)欧盟科学数据长期保存计划

欧盟科学数据长期保存计划(Permanent Access to the Records of Science in Europe)是欧盟第七研究暨技术发展框架计划资助的一项为期两年(2008—2010年)的研究项目。该项目关注科学研究过程中产生的原始数据、中期分析以及最终成果等所有数字资源的长期保存问题,希望通过研究找到确保这些珍贵的科学数字资源长期可存取、可利用、可理解的有效方法和途径,进而为欧洲信息化基础设施的整体构建提供建设性意见或指南。(53)

(5)电子文献的生命周期信息项目

电子文献的生命周期信息项目(Life Cycle Information for ELiterature,LIFE)项目,由英国联合信息系统委员会(JISC)资助,伦敦大学学院与英国国家图书馆共同实施,旨在考察与数字资源保存、管理相关的生命周期方法。项目自2005年始,2008年完成,提出了一套关于数字资源生命周期的分析方法,并在此基础上构建了一个基于生命周期的数字资源保存成本评估模型。(54)

(6)数字资源长期保存培训计划(55)

数字资源长期保存培训计划(Digital Preservation Training Programme,DPTP),是由DPC(Digital Preservation Coalition)与伦敦大学计算机中心联合举办的,是专门为那些工作在信息管理领域的工作人员设计的,提供数字信息保存所需的技能和知识。2009年4月DPC面向其成员和合作伙伴,提供两项奖学金。DPC的常务董事W illiam K ilbride博士表示:“我们很高兴能为DPC的成员提供这一优惠。DPTP将在获奖者的工作角色及更宽泛的组织范围内,丰富获奖者数字信息资源保存的知识。申请的数量和质量强调了培训的必要性。”

(7)CASPAR计划和PARSE.Insight(56)

CASPAR计划和PARSE.Insight是科学技术基金委员会(Science and Technology Funding Council,STFC)在2008—2009年资助欧洲的两个重要的加强数字保存的项目。

CASPAR计划已经运行了三年,冰基于OASI标准制订了一个数字保存框架。这一框架已经在部分领域的信息保存中进行了应用和测试,包括科学数据(来源于欧洲航天局和科学与技术设施委员会)、文化遗产(来源于联合国教科文组织)和表演艺术(来源于声乐与音乐研究中心等)领域。这些应用和测试都带来了自己领域独特的保存要求和问题。科学技术基金委员会(STFC)经过多年的积累,自己也保存着大量的科学数据。CASPAR开发了一个框架方法和基础设施来支持数字保存,这些超过了项目本身,将被长期保存。

PARSE.Insight开始于2008年,计划于2010年完成,目标在于对有关数字保存方面的多种科学学科进行调研,为欧洲未来的数字保存构筑一个全面的发展蓝图。除了综合调研外,该项目还包括在高能物理、社会科学和地球科学领域三个深入的案例研究。除科学技术基金委员会(STFC)外,其他合作伙伴包括许多著名的组织,如欧洲核子研究中心(CERN)和欧洲航天局(ESA)。该项目已经制作出了用于调研的调查问卷,以及用于确保这一调研涵盖有关数字保存的所有相关角度的草图。

(8)德国的相关项目(57)

近十年来,德国对数字资源长期保存的研究偏重于基础设施的建设和研究,其相关项目有:

KOPAL项目。由德国教育研究委员会资助,自2004年夏开始为期三年的项目,旨在建立德国范围内的数字资源存储库系统。

数字对象的唯一标识符ERICUR项目。由德国联邦教育和研究委员会资助,于2002年10月1日启动,2005年4月30日结项。其主要任务是给URN管理提供一个永久的基础设施,使它更有效率地工作;寻求能充实永久标识符系统的应用的解决方案;把永久标识符建立成书籍目录的标准表达方式,提高技术服务水平。

【参考文献】

[1]王晖.数字信息长期保存的技术策略[J].情报探索,2008(10):111-114.

[2]杨小云,魏鑫,吴玉玲.数字资源长期保存存在的问题及对策[J].农业图书情报学刊,2009,21(11):30-33.

[3]赖朝新.数字资源长期保存的主体研究[J].图书馆理论与实践,2005(2):47-48.

[4]曾怡.数字资源长期保存的成本与管理因素分析[J].现代情报,2009,29(4):93-97.

[5]李阳.数字文献长期保存的非技术因素探析[J].情报探索,2009(9):59-61.

[6]宛玲,张晓林.数字资源长期保存过程中的知识产权问题分析[J].中国图书馆学报,2005(3):65-69.

[7]王少辉.国外数字信息长期保存中的知识产权问题研究进展[J].图书情报知识,2005(6):95-98.

[8]谢永宪.数字信息长期保存的相关主体及其合作模式研究[J].图书馆学研究,2009(3):41-44.

[9]翟慧杰.数字信息长期保存的责任主体及其合作模式[J].档案,2008(1):17-19.

[10]宛玲,张晓林.数字资源长期保存权益管理政策研究[J].图书情报知识,2006(3):24-27.

[11]郭家义.数字信息资源长期保存系统的标准体系研究[J].现代图书情报技术,2006(4):14-18.

[12]郎玉林.数字信息长期保存政策因素研究[J].兰台世界,2009(5):15-16.

[13]张艳敏,马秀峰.中外数字资源长期保存策略比较研究[J].图书馆学研究,2009(6):29-32.

[14]胡燕菘.数字资源保存:相关项目与管理策略[J].图书馆工作与研究,2005(4):48-51.

[15]人民网.我国首个政府信息整合服务平台开通[EB/OL].[2009-05-04].http://scitech.people.com.cn/GB/9229828.html.

[16]国家图书馆“中国政府公开信息整合服务平台”网站[EB/OL].[2009-05-19].http://govinfo.nlc.gov.cn/gywm.jsp.

[17]Web InfoMall.中国Web信息博物馆[EB/OL].[2010-05-16].http://www.infomall.cn/.

[18]刘瑞英.国内外数字资源长期保存实践项目综述[J].光盘技术,2009(10):7-8.

[19]黄田青,陈清文,陈心蓉.LOCKSS:图书馆数字资源长期保存的新机制[J].图书馆学研究,2007(5):29-32.

[20]吴振新,李春旺,郭家义.LOCKSS数字资源长期保存策略[J].现代图书情报技术,2006(2):35-39.

[21]吴晓骏.LOCKSS数字资源长期保存策略及其应用初探[J].图书馆学研究,2007(3):25-28.

[22]Adrian Cunningham.澳大拉西亚数字长期保存的合作机制[J].潇雨编译.档案学通讯,2009(6):17-19.

[23]翟慧杰.欧洲跨国数字信息长期保存研究项目及其启示[J].兰台世界,2008(1):36-37.

[24]王媛媛,钟永恒.德国数字资源长期保存项目研究[J].情报杂志,2006(12):129-131.

[25]韩丽.国外数字信息资源合作保存及我国的发展策略[J].现代情报,2009(9):25-27.

[26]Malcolm Todd.DigitalPreservation:Managing Information for the Long Term[EB/OL].Digital Preservation Roadshows 2009-2010.[2010-05-03].http://www.dpconline.org/training/roadshows-2009-2010.html.

[27]Digital Preservation Coalition.Our Digital Memory Accessible Tomorrow,AnnualReport2008-2009[R].York:Digital Preservation Coalition,2010.

[28]JonasPalm.The Digital Black Hole[EB/OL].[2010-04-29].http://www.tape-online.net/docs/Palm_Black_Hole.pdf.

[29]Swedish Ministry of Culture.Bevara ljud och rorlig bild(SOU 2004:53)[R].Sweden:Swedish Ministry ofCulture,2004.

[30]Interview in ACM Queue[J].ACM Queue,2003,1(4).

[31]ReferenceModel for an Open Archival Information System(OAIS) CCSDS 650.0-B-1[M/OL].Washington,DC:CCSDS Secretariat,2002[2010-04-16].http://public.ccsds.org/publications/archive/650x0b1.pdf.

[32]Lorcan Dempsey,Brian Kelly,Anne Mumforde.Lib Standards Guidelines[EB/OL].[2010-04-29].http://www.ukoln.ac.uk/services/elib/papers/other/standards/version2/.

[33]Jeff Rothenberg.Avoiding Technological Quicksand:Finding a Viable Technical Foundation for Digital Preservation[EB/OL].[2009-12-10].http://www.clir.org/pubs/reports/rothenberg/contents.html.

[34]UNESCO.Charter on the Preservation of the Digital Heritage[M/OL].Paris:UNESCO,2003[2010-03-29].http://portal.unesco.org/ci/en/ev.php-URL_ID=13367&URL_ DO=DO_TOPIC&URL_SECTION=201.html.

[35]Library of Congress.Saving Our Digital Lives[EB/OL].[2010-03-29].http://www.digitalpreservation.gov/edge/edge_ bl.html.

[36]United States Congress.111th Congress 2d Session H.R..1387 ElectronicMessagePreservation Act[M].Washington,DC: United StatesCongress,2010-03-17.

[37]United States Congress.H.R.1387 Electronic Message Preservation Act(GovTrack.us)[EB/OL].[2010-04-10].http://www.govtrack.us/congress/bill.xpd?bill=h111-1387.

[38]National Library of Australia.PANDORA Project[EB/OL].[2010-03-05].http://www.nla.gov.au/policy/plan/pandora.html.

[39]W ikipedia.CAM iLEON[EB/OL].[2010-03-15].http://en.wikipedia.org/wiki/CAM iLEON.

[40]Catherine Lupocici,Julien Masanes.Metadata for Long Term Preservation NEDLIB Report Series,2[R/OL].Netherlands: NEDLIB,2000.[2008-05-15].http://www.kb.nl/coop/nedlib/results/D4.2/D4.2.htm.

[41]Jeff Rothenberg.An Experiment in Using Emulation to Preserve Digital Publications NEDLIB report series,1[R/OL].Netherlands:NEDLIB,2000.[2008-05-15].http://www.kb.nl/coop/nedlib/results/emulationpreservationreport.pdf.

[42]Cedars Project Team.Metadata for Digital Preservation:the Cedars ProjectOutline Specification(Cedars,2000)[EB/OL].[2010-03-27].http://www.leeds.ac.uk/cedars/colman/metadata/metadataspec.html.

[43]Wikipedia.Digital Preservation Coalition[EB/OL].[2010-03-27].http://en.wikipedia.org/wiki/Digital_Preservation_ Coalition.

[44]Digital Preservation Coalition.About the DPC[EB/OL].[2010-04-01].http://www.dpconline.org/about/index.html.

[45]Digital Curation Centre.About the DCC[EB/OL].[2010-05-01].http://www.dcc.ac.uk/about-us.

【作者简介】

img107

刘家真,女,信息管理学院/政治与公共管理学院博士生导师,教授;武汉大学电子政务研究所所长,国家精品课“电子文件管理”课程负责人,全国电子政务理事会理事,中国图书馆学会分委员会委员,国家古籍保护工作专家委员会委员。硕士生培养方向为:电子政务与文件管理。博士生培养方向为:政府信息化与电子文件管理,数字信息资源管理。目前已出版《电子文件管理:电子文件与证据保留》等十余部专著与教材,发表论文数十篇。

刘莉,女,武汉大学信息管理学院2009级硕士研究生。

【注释】

(1)王晖.数字信息长期保存的技术策略[J].情报探索,2008,10(10):111-114.

(2)Malcolm Todd.Digital Preservation:Managing Information for the Long Term[EB/OL].DigitalPreservation Roadshows 2009–2010[2010-05-03].http://www.dpconline.org/training/roadshows-2009-2010.html.

(3)Digital Preservation Coalition.Our Digital Memory Accessible Tomorrow,AnnualReport2008-2009[R].York:DigitalPreservation Coalition,2010.

(4)杨小云,魏鑫,吴玉玲.数字资源长期保存存在的问题及对策[J].农业图书情报学刊,2009,21(11):30-33.

(5)赖朝新.数字资源长期保存的主体研究[J].图书馆理论与实践,2005,(2):47-48.

(6)曾怡.数字资源长期保存的成本与管理因素分析[J].现代情报,2009,29(4):93-97.

(7)李阳.数字文献长期保存的非技术因素探析[J].情报探索,2009(9):59-61.

(8)Jonas Palm.The Digital Black Hole[EB/OL].[2010-04-29].http:// www.tape-online.net/docs/Palm_Black_Hole.pdf.

(9)Swedish M inistry ofCulture.Bevara ljud och rorlig bild(SOU 2004:53)[R].Sweden:Swedish M inistry ofCulture,2004.

(10)Interview in ACM Queue[J].ACM Queue,2003,1(4).

(11)DigitalPreservation Coalition.Our Digital Memory Accessible Tomorrow,AnnualReport2008-2009[R].York:DigitalPreservation Coalition,2010.

(12)ReferenceModel for an Open Archival Information System(OA IS)CCSDS 650.0-B-1[M/OL].Washington,DC:CCSDS Secretariat,2002[2010-04-16].http://public.ccsds.org/publications/archive/650x0b1.pdf.

(13)宛玲,张晓林.数字资源长期保存过程中的知识产权问题分析[J].中国图书馆学报,2005,(3):65-69.

(14)王少辉.国外数字信息长期保存中的知识产权问题研究进展[J].图书情报知识,2005,(107):95-98.

(15)谢永宪.数字信息长期保存的相关主体及其合作模式研究[J].图书馆学研究,2009(3):41-44.

(16)翟慧杰.数字信息长期保存的责任主体及其合作模式[J].档案,2008(1):17-19.

(17)宛玲,张晓林.数字资源长期保存权益管理政策研究[J].图书情报知识,2006(3):24-27.

(18)郭家义.数字信息资源长期保存系统的标准体系研究[J].现代图书情报技术,2006(4):14-18.

(19)Lorcan Dempsey,Brian Kelly,AnneMumforde.Lib StandardsGuidelines[EB/OL].[2010-04-29].http://www.ukoln.ac.uk/services/elib/papers/other/standards/version2/.

(20)Jeff Rothenberg.Avoiding Technological Quicksand:Finding a Viable Technical Foundation for Digital Preservation[EB/OL].[2009-12-10].http:// www.clir.org/pubs/reports/rothenberg/contents.html.

(21)郎玉林.数字信息长期保存政策因素研究[J].兰台世界,2009,(5):15-16.

(22)Unesco.Charter on the Preservation of theDigitalHeritage[M/OL].Paris: UNESCO,2003.[2010-03-29].http://portal.unesco.org/ci/en/ev.php-URL_ID= 13367&URL_DO=DO_TOPIC&URL_SECTION=201.html.

(23)Library ofCongress.Saving Our Digital Lives[EB/OL].[2010-03-29].http://www.digitalpreservation.gov/edge/edge_bl.htm l.

(24)United States Congress,111th Congress2d Session H.R..1387 Electronic MessagePreservation Act[M].Washington,DC:United StatesCongress,2010-03-17.

(25)United States Congress.H.R..1387 Electronic Message Preservation Act(GovTrack.us)[EB/OL].[2010-04-10].http://www.govtrack.us/congress/ bill.xpd?bill=h111-1387.

(26)National Library of Australia.PANDORA Project[EB/OL].[2010-03-05].http://www.nla.gov.au/policy/plan/pandora.htm l.

(27)韩丽.国外数字信息资源合作保存及我国的发展策略[J].现代情报,2009,9(9):25-27.

(28)Wikipedia.CAMiLEON[EB/OL].[2010-03-15].http:// en.wikipedia.org/wiki/CAM iLEON.

(29)Catherine Lupocici,Julien Masanes.Metadata for Long Term Preservation NEDLIB Report Series,2[R/OL].Netherlands:NEDLIB,2000.[2008-05-15].http://www.kb.nl/coop/nedlib/results/D4.2/D4.2.htm.

(30)Jeff Rothenberg.An Experiment in Using Emulation to Preserve Digital PublicationsNEDLIB Report Series,1[R/OL].Netherlands:NEDLIB,2000.[2008-05-15].http://www.kb.nl/coop/nedlib/results/emulationpreservationreport.pdf.

(31)韩丽.国外数字信息资源合作保存及我国的发展策略[J].现代情报,2009,9(9):25-27.

(32)Cedars Project Team.Metadata for DigitalPreservation:the Cedars Project Outline Specification(Cedars,2000)[EB/OL].[2010-03-27].http:// www.leeds.ac.uk/cedars/colman/metadata/metadataspec.html.

(33)Wikipedia.Digital preservation coalition[EB/OL].[2010-03-27].http://en.wikipedia.org/wiki/Digital_Preservation_Coalition.

(34)Digital Preservation Coalition.About theDPC[EB/OL].[2010-04-01].http://www.dpconline.org/about/index.html.

(35)Digital Curation Centre.About the DCC[EB/OL].[2010-05-01].http://www.dcc.ac.uk/about-us.

(36)张艳敏,马秀峰.中外数字资源长期保存策略比较研究[J].图书馆学研究,2009(6):29-32.

(37)胡燕菘.数字资源保存:相关项目与管理策略[J].图书馆工作与研究,2005(4):48-51.

(38)人民网.我国首个政府信息整合服务平台开通[EB/OL].[2009-05-04].http://scitech.people.com.cn/GB/9229828.html.

(39)国家图书馆“中国政府公开信息整合服务平台”网站[EB/OL].[2009-05-19].http://govinfo.nlc.gov.cn/gywm.jsp.

(40)Web InfoMall.中国web信息博物馆[EB/OL].[2010-05-16].http://www.infomall.cn/.

(41)刘瑞英.国内外数字资源长期保存实践项目综述[J].光盘技术,2009(10):7-8.

(42)黄田青,陈清文,陈心蓉.LOCKSS:图书馆数字资源长期保存的新机制[J].图书馆学研究,2007(5):29-32.

(43)胡燕菘.数字资源保存:相关项目与管理策略[J].图书馆工作与研究,2005(4):48-51.

(44)刘瑞英.国内外数字资源长期保存实践项目综述[J].光盘技术,2009(10):7-8.

(45)吴振新,李春旺,郭家义.LOCKSS数字资源长期保存策略[J].现代图书情报技术,2006(2):35-39.

(46)黄田青,陈清文,陈心蓉.LOCKSS:图书馆数字资源长期保存的新机制[J].图书馆学研究,2007(5):29-32.

(47)吴晓骏.LOCKSS数字资源长期保存策略及其应用初探[J].图书馆学研究,2007(3):25-28.

(48)胡燕菘.数字资源保存:相关项目与管理策略[J].图书馆工作与研究,2005(4):48-51.

(49)Adrian Cunningham.澳大利亚数字长期保存的合作机制[J].潇雨编译.档案学通讯,2009(6):17-19.

(50)胡燕菘.数字资源保存:相关项目与管理策略[J].图书馆工作与研究,2005(4):48-51.

(51)胡燕菘.数字资源保存:相关项目与管理策略[J].图书馆工作与研究,2005(4):48-51.

(52)翟慧杰.欧洲跨国数字信息长期保存研究项目及其启示[J].兰台世界,2008(1):36-37.

(53)刘瑞英.国内外数字资源长期保存实践项目综述[J].光盘技术,2009(10):7-8.

(54)刘瑞英.国内外数字资源长期保存实践项目综述[J].光盘技术,2009(10):7-8.

(55)DigitalPreservation Coalition.Our Digital Memory Accessible Tomorrow,Annual Report2008-2009[R].York:Digital Preservation Coalition,2010.

(56)DigitalPreservation Coalition.Our Digital Memory Accessible Tomorrow,AnnualReport2008-2009[R].York:Digital Preservation Coalition,2010.

(57)王媛媛,钟永恒.德国数字资源长期保存项目研究[J].情报杂志,2006(12):129-131.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈