首页 理论教育 数字信息长期保存与维护的策略

数字信息长期保存与维护的策略

时间:2022-03-10 理论教育 版权反馈
【摘要】:2005年5月,美国国会图书馆和自然科学基金会合作向10所大学颁发了300万美元的奖金以表彰其在数字信息长期管理领域的先锋研究,这是它们合作资助的第一个数字保存项目的成果。该工作组发布的最终报告设想了一个国家数字档案系统,指出数字档案馆与数字图书馆在长期存在数字信息这一方面有着明显的不同。数字信息保存的法律问题早已引起图书馆界的重视。

5.3 数字信息长期保存与维护的策略

5.3.1 争取政府的支持

欧洲委员会于2001年11月起资助了电子资源保存与存取网(Electronic Resource Preservation and Access Network,简称ERPANET)项目,旨在建立对文化遗产科学信息进行长期保存的可扩展的欧洲联盟,建立保存文化遗产和科学数字对象领域的虚拟数据交换中心和知识存储库。该项目由来自英国、荷兰、意大利和瑞士的博物馆、图书馆、档案馆、信息交流技术和软件行业、研究机构、政府组织以及商业机构等合作进行(54)

2005年5月,美国国会图书馆和自然科学基金会合作向10所大学颁发了300万美元的奖金以表彰其在数字信息长期管理领域的先锋研究,这是它们合作资助的第一个数字保存项目的成果。1994年底,美国保护与存取委员会(Commission on Preservation and Access,简称CPA)与美国研究图书馆组织(RLG)组建了一个数字信息档案化特别工作组,负责调研与推荐能确保“数字式电子格式文件未来连续存取”的方法(55)。该工作组发布的最终报告设想了一个国家数字档案系统,指出数字档案馆与数字图书馆在长期存在数字信息这一方面有着明显的不同。报告总结出一系列委员会与研究图书馆团体需要采取的措施,包括:向全国现有的或建设中的数字档案馆征求方案,在一个合作项目中为挑选的合作伙伴提供服务,以保证早期数字化时期的信息资源在一个时期的可用性;保证为发展数字档案馆的资金与赞助商的公开竞争,尤其要消除数字信息保存的法律及经济障碍;在档案保存的技术应用与服务方面,培育实际的实践和示范项目;为设计和发展国家信息基础结构,积极致力于国家政策效力方面,保证信息的长寿是一个明确目标;为发展有效的自动防止故障性结构(Fail-safe),资助一个合法的研究机构进行白皮书的准备;组织好来自于不同学科领域的专业社团的代表,以引出关于特定信息的创建与经费来源的创造性建议;在相应的机构和个人中建立一个作为数字档案馆的数字信息集合的标准、准则和结构的目录;为协调美国数字保存的创始计划与其他国家的类似项目,确定一个执行协调任务的行政机构;确定当前最好的实践和费用水准基点,包括:设计归档系统、巨量的有文化价值的数字信息集合,描述和管理数字信息的要求标准,有文化价值的数字信息的迁移通道(Migration Paths)。(56)

英国联合信息系统委员会(JISC)2000—2006年资助了“数字保存与记录管理”(Digital Preservation and Records Management,简称DPRM)项目,项目的目标有:确定与英国高等教育相关的数字信息资源的长期保存策略并监督其实施,提出以英国为主的各种媒体的数字资源保护和记录管理相关的建议、政策与策略,支持并联合资助世界范围内数字保存领域的适当的机构间的合作,对JISC就数字保存与记录管理提供咨询,管理JISC的电子与纸质记录(57)

澳大利亚国家的“保存对数字信息的存取”(Preserving Access to Digital Information,简称PADI)创始计划网站列举了世界各国关于数字信息资源保存的政策、策略与指南(58)

5.3.2 积极应对数字信息保存的法律挑战

由于网络信息的特殊性,网络信息的生产者可以自由地在网上发布网络信息,其本身并无责任承担信息的保存任务,但作为保存人类文化遗产传统机构的图书馆,要想承担网络信息的保存责任,却面临着最大的问题,即知识产权的困扰。因为图书馆是否有权将其捕获到的网络信息加以保存,目前的知识产权法还没有明确的规定,而图书馆需要为长期保存网络信息资源而进行必要的格式转换、复制拷贝和提供信息的检索等,这样在图书馆进行网络信息保存过程中就涉及大量的知识产权保护问题。所以,知识产权保护问题已成为网络信息长期保存工作的一个重大障碍,急需得到很好的解决(59)

数字信息保存的法律问题早已引起图书馆界的重视。美国国会图书馆召集、选择了一些版权专家组建了108分部研究组(Section108 Study Group),负责研究数字时代版权法如何处理信息资源创建者或版权持有人与图书馆和档案馆需求之间的关系。英国艺术与人文科学研究咨询委员会(The Arts and Humanities Research Council,简称AHRC)资助了“数字保存的版权与许可”(Copyright and Licensing for Digital Preservation,简称CLDP)项目(60)

2003年,Adrienne Muir就英国与数字保存有关的机构与立法环境进行了调查(61)。Adrienne Muir于2004年撰文指出,数字信息保存涉及复制,而英国法律是否允许复制尚不够清晰,而用于复制的许可协议又相当耗时与复杂,“存取”而非“拥有”的藏书模式意味着图书馆可能不能够保存资源,需要进行其他的安排,对此有不同的解决办法,包括:拓展呈缴法,修改版权法与其他相关法律,设立和利用保存许可条款或集团许可,提供保存权限元数据(62)

加州大学洛杉矶分校图书馆数字资源管理与许可部的主任Sharon E.Farb博士于2005年就美国大学图书馆和出版商对数字信息资源许可的问题进行了调查,调查表明,并非所有的图书馆都打算为其不断增长的获得许可的数字收藏和资源进行长期保存和提供存取,而是依赖于第三方去完成这一重要任务(63)。她还在《图书馆许可与保管的挑战》一文中指出:长期以来,保存一直被视为图书馆的主要责任,保管(Stewardship)与许可都影响对数字信息资源的管理和有控制的使用,保管是为后代的保存,保管是为了保证获得许可的数字信息资源(Licensed Digital Resources,简称LDR)的可持续发展,保管是为了保证数字信息资源的完整性与真实性,保管是为了用户与社会利益的服务;但调查表明,70%的美国学术图书馆尚未制定对获得许可的数字信息资源进行长期保存与使用的计划,现有的许可协议中60%没有包括存档权限,55%没有包括永久使用(Perpetual Access),25%没有包括合理使用。对数字信息资源的长期保存相当迫切,需要制定对获得许可的数字信息资源的长期存取与使用(Long-term Access and Use)的政策框架与日程(64)

5.3.3 确定数字信息资源保存的主体

对于印本资源的长期保存,各国都有完善的缴存本制度,有法律支持的规范的责任体系。但对于数字资源,特别是数字图书馆应用的数字资源及网络资源的保存,目前各国还普遍缺乏法律上明文的规定。联合国教科文组织2003年8月19日发表的《保存数字化遗产宪章草案》第八条提出,为了保护数字化遗产,各会员国须有必要的法律框架,仅依靠市场力量不行,同时建议会员国制定的国家遗产保存政策应该保证图书馆等公共文献保存机构可以在缴送法制或其他法律强制力的作用下获得数字化遗产(65)。这样,传统的保存机构——图书馆,在数字信息资源保存活动中,责无旁贷地成为了主要实施者。目前有些国家已经修改了出版物缴送方面的相关法律,将网络文献定为法定缴送对象。如1997年6月丹麦修改缴送制度,明确规定网络上的静态作品(Static Work)属于正式的缴送对象。同时出版机构和一些非营利信息服务机构也发挥了相当作用。

(1)国家图书馆

保存人类文献资源一直是图书馆的重要职责,国家图书馆尤其如此。以澳大利亚网络信息保存研究工作者为代表的学者认为,作为传统文献保存机构的图书馆、档案馆应当负有保存网络信息的重要责任。2002年6月27日,国际图联在其与国际出版社协会发表的《永久保存世界记忆:关于保存数字化信息的联合声明》(IFLA/IPA Preserving the Memory of the World in Perpetuity:a Joint Statement on Archiving and Preserving Digital Information)中也指出,“出版机构承诺短期保存他们出版的数字形式的出版物,而图书馆则应通过与出版机构的协商,承担起长期保存这类出版物的责任”。“各国的国家图书馆是获取和保存各国这类形式出版物的最佳场所,实际上许多的国家图书馆也正在从事这项工作,国家图书馆与其他一些主要图书馆和图书馆组织应该担负起长期保存数字信息的主要责任。”(66)

澳大利亚国家图书馆早在1996年就制定了《澳大利亚电子出版物的国家策略》,当时的重点是放在光盘文献上,随后启动了著名的PANDORA数字保存项目,目前已经建设成用户可以直接访问的国家联机出版物知识库。澳大利亚国家图书馆认识到长期存储因特网上重要的联机出版物远非单个图书馆可以完成,因此联合了7家州级图书馆,形成了分布式的保存网络——国家模型。PANDORA站点成为其重要的组成部分。

美国国会图书馆已开始收集同时代的数字形式的文献。2003年初国会图书馆通过了国家数字信息基础设施和保存规划(National Digital Information Infrastructure and Preservation Infrastructure,简称NDIIPP),获得1亿美元来发展、设计和实现国家的数字资源长期保存基础结构。

荷兰国家图书馆早在1994年就将保存电子出版物作为其重要职能之一。1998年参加了欧洲国家图书馆合作项目NEDLIB,积极研究相关机制。与IBM公司合作,从2001年起开始建立电子出版物存储系统e-deposit,最新系统于2003年1月启用。1999年与荷兰出版协会达成了关于存储联机和脱机出版物的一个总协议,为国家图书馆开展存储电子出版物活动奠定了基础。2002年8月和2003年5月,分别与Elsevier Science公司和Kluwer公司正式签署长期保存其联机期刊和电子图书的协议,接受该公司缴送的1500种超过7TB的电子期刊。这是一种典型的建立国家存档的行为,最大程度地保障了国家的公共利益(67)

英国、法国、加拿大等国的国家图书馆,以及一些专业性公共图书馆,如美国医学图书馆等也都在其数字图书馆建设中不同程度地开展了数字资源的长期保存活动。

(2)高校图书馆

数字图书馆应用的数字资源,有来自于网络上的海量数字资源,而其中最具保存价值的应当是学术性资源。而这些资源通常来源于和应用于高校,所以高校图书馆应成为长期保存活动中不可忽视的主力。比较有典型代表意义的有以下图书馆。

加州大学建设了世界著名的加州数字图书馆(California Digital Library,简称CDL)。CDL已实施e-Scholarship计划(68),使其成为全校数字资源保存中心。在该计划中,CDL在各学院图书馆、研究机构、实验室以及博物馆建有节点,为用户提供本地化专门的保存服务,同时依据CDL分布式系统结构支持公共保存需要。该系统保存的内容包括其员工所创造的数据集、预印本以及其学院图书馆不收藏的资料。

麻省理工学院图书馆与美国惠普公司合作,于2002年底建立并正式启动了新型多媒体数字图书馆系统Dspace,这是一个获取、传播和保存该校智力产出的数字图书馆。该系统具备处理该校教师和研究人员每年完成的总计1万多份数字化科研成果的能力。该校的员工按照Dspace提供的提交页面可直接与图书馆工作人员联系,将自己的成果数字化并长期存储在该系统中;最终用户可以通过它访问和查询图书馆收藏的论文;而研究单位可以对本单位的数字化科研产出进行统一的管理和使用。该图书馆已运用Dspace概念发展了研究图书馆Dspace联盟。

英国剑桥大学图书馆与该校计算机服务中心合作,加入了Dspace联盟启动项目,正在建立Dspace@Cambrige存储库。该项目从2002年底开始,计划到2005年建成。此系统将存储剑桥大学图书馆自己数字化的资料和该校其他机构创造的数字资源。该馆还参加了已经结项的“数字档案卷曲典范”(Curl Exemplars in Digital Archives,简称CEDARS)等长期保存项目。(69)

此外还有哈佛大学、斯坦福大学等大学的图书馆开展了数字资源长期保存的活动。哈佛大学有100来个图书馆,每个图书馆都有责任选择需要保存的资源。斯坦福大学图书馆建立了一个长期保存自产和外购数字资源的数字知识库,还开发了数字典藏的“多备份资源保存”(Lots of Copies Keep Stuff Safe,简称LOCKSS)系统,致力于解决电子期刊的保存和利用的相关技术问题等(70)

(3)出版商等数字信息资源的生产者

以美国数字信息归档特别工作组为代表的学者强调避免有价值的数字信息丢失的第一道防线应该建立在网络信息的形成者、提供者与拥有者的责任上,数字信息只有在其产生的环境里加以保存和维护才是最经济的(71)

在数字环境下,出版商也开始涉足保存领域,而且在保存方面起到关键作用。对于数字资源,出版商通常仅提供给各订购者对数字资源的使用权。在这种情况下,出版商无疑就需要承担对数字资源的维护任务。但是否提供长期保存,并没有普遍的做法。目前有不少数据库商提供若干年的回溯数据,在合同期内他们必须保证这些资源的可使用性,如Elsevier,EI,IEEE等公司都保证用户可以回溯检索其一定时期的出版物,这种保证是其商业动作的一部分,具有一定的保存意义,但还不能说是一种长期保存行为。面对订购方越来越重视数字资源长期存取的发展趋势,不少出版商开始寻求可靠的第三方承担长期保存的责任。也有的出版商应要求给予订购方对所购资源的永久使用权,实施了一种长期保存的行为。

(4)非营利信息机构

并非所有大学甚至包括一些著名大学都提供长期保存服务,许多出版商既不承诺进行长期保存,也没有选择第三方实施或授权于订购方,而目前社会上又没有一种提供这种服务的机制,因而许多数字资源找不到长期保存的归宿。在这种背景下,一些非营利机构开始了有益的尝试。最有名的有美国的OCLC和RLG,他们正为其成员单位开展长期保存成员单位数据的服务。

此外,赵俊玲等从短期保存、长期保存、辅助保存体系等几个方面分析了网络信息保存的责任方,提出网络信息保存的责任体系(72)

5.3.4 选择需要保存的数字信息资源

从总体而言,凡是有价值的数字信息资源都应当被保护,既应包括历史资料,也应包括当前的最新资料。被NDIIPP网站誉为“数字保存先锋”的美国国家记录咨询服务部前任主席、现任密西根大学信息学院副教授Margaret Hedstrom认为,当前数字保存中偏向于某些文化中历史资料的保存。NDIIPP网站还指出,不仅要保存国家数字信息资源,还要注意个人数字信息资源的保存,并向网络用户传授了保存电子邮件、计算机文档和数字照片的技巧(73)。甚至有专门讨论电子邮件保存的著作——《关于电子邮件长期保存的数字保存试验台和电子邮件保存动画最终推荐意见稿》(74)

从经济角度看,没有必要也没有可能对所有机构库,或每一个文献都转换成长期保存的数字档案(75)。但就某一个项目而言,其保存的对象是有一定限制的。在美国的NDIIPP项目中,OCLC、伊利诺伊大学香槟分校图书馆和图书情报学院以及美国国家超级计算应用中心的任务就是制定一个选择标准以确定哪些数字信息资源需要捕捉与保存,最终确定保存与美国历史上有重要影响的重要人物、事件和活动相关的数字内容,例如DOT.COM诞生时代的商业网站档案、卫星地图、全国与各州数字地图、公共电视节目、历史上的航空摄影、民意测验和投票记录等。

(1)优先保存有消失危险的数字信息资源

2004年,美国国会图书馆和NDIIPP的其他合作者识别了大约66TB(1TB约相当于100万本图书的文字内容)的有消失危险的网站、数字电视、商业记录、社会科学数据集、地理空间数据、文化传统资料和电子出版物,并选择一部分进行了数字保存。2005年,与一个非营利性的电子存档服务机构Portico合作,创建了对以电子形式出版的学术资源进行永久存档服务的商业模型,先从电子期刊开始。截至2007年12月3日,存档的期刊有3 296种,承诺存档的期刊7 208种,参与的图书馆393个(76)

在此过程中,要充分发挥各方面的作用,包括学者(77)

(2)选择有重要价值的资源进行保存

并非所有的信息资源都需要马上保存,存在一个优先选择问题。2003年OCLC学者提出,现代记录的丰富使我们不可能什么都保存,因此,存档者需要做出艰难的选择。选择的标准有:记录对机构的价值(如作用、对组织活动的影响)、信息资源的内容、未来的用途等(78)。1996年,澳大利亚国家图书馆制定《保存网上出版物的选择方针》。该方针的基本要点包括:收集的资源包括澳大利亚作者完成的关于澳大利亚的社会、政治、文化、宗教、科学和经济信息;这些资源可以在澳大利亚或海外的服务器上;当一个标题内容可以通过印刷品和网上获得时,只保存印刷形式;有研究价值的权威出版物拥有选择的最优先权;图书馆并不保存网站所有的变化,而是建立每个标题内容定期收集制度。关于这方面的操作指南,可参考美国研究图书馆组织与OCLC 2002年发布的报告《可信的数字资源:作用与责任》(79)

此外,还要确定保存的数字信息资源的类型。

5.3.5 选择数字信息保存的技术措施

目前实现数字信息长期保存的技术措施主要有:仿真(Emulation)、更新(Refreshing)、转换(Turning)、迁移(Migration)和再生性保护技术。这方面的成果很多,在此不再赘述。

5.3.6 在数字信息资源生产过程中注意数据的备份

进入21世纪以来,数字信息技术在各行各业得到了广泛的推广和使用,大量的企事业单位逐步淘汰了原始的手工管理,使用了先进的信息管理系统作为企事业单位重要的管理平台,使单位的工作效率得到了极大提高,也节约了大量的成本。然而,随着人们对信息技术的依赖性越来越高,信息系统本身存在的风险也成了企事业单位经营管理过程中的巨大风险。规避风险的最好办法就是做备份。数据的备份无外乎两种:数据库备份和文件备份。一款优秀的备份软件,不管是针对数据库还是针对文件,应该可以做到实时备份、安全备份和容灾备份。这应该是一个自动备份和智能备份的热备过程(80)

国家信息中心信息安全研究与服务中心认为,一个优秀的灾备系统首先应该是自动智能的,这样可以减少人员负担,勿需人工干预,备份工作自动执行;其次要实现实时备份(CDP,持续数据保护)功能,因为实时备份保证了备份数据和主数据的一致性,当主数据发生任何故障,备份的数据则是完整的;再次还要实现异地容灾,这样可支持数据实时备份至异地,确保在发生灾难时也能找回数据;还有类似的回退功能、接管功能,等等。当然,其他的低耗能源、简单易用、性价比高等也是一个合格的备份系统必须做到的,只有这样,我们的数据才算是真正的备份了(81)

5.3.7 及时进行数字信息的恢复与修复

随着计算机的迅速普及,很多关键性的数据和智慧财产已经“无纸化”,数字信息在社会经济中的地位越来越重要。许多重要的数据都做了备份并归档保存,而且采取了许多安全措施以维护它们的物理形态安全。但这只能维护数据的安全存在,并不能保证这些数据在多年之后还会被人理解。

数字技术在不断地发生变化,数字资源面临着因技术平台的频繁变迁而可能读不出信息的风险,因而要化解技术淘汰带来的难题,我们也须采用技术的手段来解决技术的问题。而这些技术手段与解决方案都涉及许多前沿技术,风险很大,不是一般的单个的部门可以解决的。因而,有必要在我国建立数字信息恢复中心来承担数字资源长期保存过程中的技术问题。

近年来,我国已经建立了上百家数据恢复中心,它们的服务领域主要是针对由于硬件、软件故障或其他灾祸带来的数据损失的恢复(82)。为了适应信息安全的需要,国家信息中心信息安全研究与服务中心在引进国际先进的数据修复技术的基础上,自主研发了适合中国计算机用户的数据修复技术,是国内首家提供数据恢复服务的单位,自1999年开展数据恢复业务以来,在硬件及磁盘阵列服务器数据恢复技术上一直处于国内领先水平,并积累了大量的成功案例,得到了广大用户和主管单位的好评,主要服务规范已成为业内事实标准。2001年被原国家信息化领导小组计算机网络与信息安全管理办公室定为国家计算机应急恢复服务定点单位。

著名的数字信息资源典藏系统LOCKSS对内容采取多站点分布式存档,这些分布式档案不断地进行交流以比较内容的不同,若一个站点的数字内容毁坏,毁坏的内容可进行自动修复。

5.3.8 开发数字信息资源保存和提供利用的工具

在NDIIPP项目中,加州大学数字图书馆及其合作者纽约大学和北德克萨斯大学图书馆的贡献就在于开发图书馆可用的捕捉和保存网上政府与政治信息的Web存档工具。

美国麻省理工学院图书馆(MIT Libraries)和美国惠普公司实验室(Hewlett-Packard Labs)合作,经过两年多的努力并于2002年10月开始投入使用的DSpace(数字空间)系统是一个专门的数字资产管理系统,它管理和发布由数字文件或“位流”(Bitstreams)组成的数字条目(Item),并且允许创建、索引和搜索相关的元数据以便定位和存取该条目。它包括的基本概念主要有:数字空间群(DSpace Communite),数字空间群是针对数字材料的长期保存而设计的。数字材料来源于不同的组群,比如大学的院系、实验室,图书馆的采访、编目等部门,这些依据不同的授权完成不同任务的组群称作数字空间群。

DSpace系统可以存储、管理和发布任何已经和未经出版的本地馆藏,保证印刷和数字文献的统一索引和定位,它可以接受的数字信息资源包括:论文与预印稿(Articles and Preprints)、技术报告(Technical Reports)、工作论文(Working Papers)、会议论文(Conference Papers)、电子学位论文(E-theses)、数据集(Datasets,包括统计数据、地理信息数据、数学等)、图像(Images,包括可视化图像、科学图表等)、声频文件(Audio Files)、视频文件(Video Files)、学习对象(Learning Objects)和重定格式后的数字图书馆馆藏(Reformatted Digital LibraryCollections)。

2005年6月,国会图书馆发布的《档案吸纳与处理最终报告》对数字信息资源保存中的许多技术问题进行了探讨(83)

5.3.9 确定数字信息资源保存的程序

美国NDIIPP提出的构建图很清晰地反映了数字信息保护与存取的主要环节及其说明(84)。在这些流程中,用于数字信息保存的元数据管理十分重要。2005年5月,OCLC和RLG已发布用于支持数字资源长期保存的核心元数据综合指南(85)。保存元数据(Preservation Metadata)是支持与记录数字资源长期保存的信息,包括:与信息媒体有关的信息、重要属性、使用环境、稳定性、技术属性、由来,等等(86)。“保存元数据:执行策略”(Preservation Metadata:Implementation Strategies,简称PREMIS)项目吸引了国际上30余位来自图书馆、博物馆、档案馆、政府与私人部门的专家参与,其工作组发布了该项目的最终报告《保存元数据数据词典》,这是国际上该领域共同努力的结果(87)

为了确保不同资源库之间的资源共享,要注意元数据的映射。如美国NDIIPP、国家地理空间数据存档项目(NGDA)、德国机构库证书项目DINI等进行了成功尝试。数字保存网站制作了美国国会图书馆数字保存项目“档案吸收与处理测试”(The Archive Ingest and Handling Test,简称AIHT)到元数据输入与传播标准(Metadata Encoding and Transmission Standard,简称METS)转换的详细工作单(88)

保存元数据的未来发展方向是开发自动化的元数据抽取工具、不同的资源库间共享元数据以及数据创建者的合作。

5.3.10 制定标准规范

数字信息资源的数量正在逐渐增加。现在和未来要存取这些内容,就会面临实践、理论和组织上的挑战。数字化信息的长期存储价值、可用性有赖于大量的标准,如存储格式、联合元数据的采集等。

近年来,ISO、美国国家信息标准组织(NISO)以及其他一些政府和民间机构都不同程度地研制了标准和规范,并在实践领域得到应用。这些无疑对开展数字资源长期保存活动起到了很好的规范和引导作用。

在数字资源长期保存领域,最有影响的标准当属开放档案信息参考模型(Open Archival Information System,简称OAIS)。1999年美国空间数字系统咨询委员会(Consultative Committee for Space Data Systems,简称CCSDS)提出了OAIS,并提交ISO成为ISO标准草案(89)。经过3年讨论修改,2002年1月出版了ISO蓝皮书版本,现已正式成为ISO标准ISO14721:2003。实际上在OAIS还是标准草案时,几乎所有大型的长期保存项目都将它作为实施标准。许多机构结合自身特点和需求,建立了基于OAIS的本地长期保存基础结构,如美国哈佛大学1998年开始的5年规划项目“图书馆数字创始计划”(Library Digital Initiative,LDI)。虽然OAIS是由美国空间数据系统委员会提出,但图书馆界为OAIS的修改做出了相当大的贡献。目前,美国研究图书馆组织(RLG)正在进行一个3年期的项目(2002—2004年),推广OAIS的应用。

目前还没有一个统一通用的数字资源长期保存元数据规范格式,许多长期保存项目建立了项目内部通用的元数据格式,如澳大利亚的“保护与存取网络化的澳大利亚文献资源”(Preserving and Accessing Networked Documentary Resources of Australia,简称PANDORA)项目(90)、“网络化欧洲存储图书馆”(Networked European Deposit Library,简称NEDLIB)项目(91)等。但也有的元数据格式已在国际上被广泛引用,如美国国会图书馆制定的专门用于多媒体保存描述的METS元数据格式。2002年6月,OCLC和RLG共同发布了保存元数据方面的报告《支持数字物件保存的元数据框架》(92)

其他相关的标准还有:美国国家信息标准组织制定的Z39.87:数据字典——描述数字图像的技术元数据。实际上数字资源长期保存并不是一种孤立的活动,数字资源建设中的许多标准诸如内容描述标准、唯一标识符标准、XML等都是工作中需要引用的。

5.3.11 关注数字信息保存中的经济问题

尽管在数字资源的可持续性存取中已经克服了诸多的技术问题,取得了很大的成就,经济上面临的挑战依然存在。数字信息资源数量巨大,虽然无需全部保存,但即使有选择地进行保存,其保存的累计成本也是较高的,这些费用包括保存数字信息资源所需费用、使用信息资源所需费用以及与数字信息资源保存相关人员的费用,因此,要对数字信息资源长期保存的费用有合理的估计与长远的规划,制定一个能支持数字信息资源保存活动长期进行的费用框架与相应的经费管理措施,要有一个中心机构协调。

2007年9月,美国国家基金会和梅隆基金会资助“蓝带特别小组”(Blue-ribbon Task Force),关注数字保存和持续存取在经济上的可持续性发展。该小组将由两位重要人物来共同领导:一位是加州大学圣地亚哥分校超级计算中心主任、网络信息基础设施(Cyberinfrastructure)的倡导者Fran Berman;另一位是OCLC科学家、同时也是一位对数字保存有着浓厚兴趣的经济学家Brian Lavoie。支持该小组的其他机构有:美国国会图书馆、美国国家档案与记录管理局(National Archives and Records Administration)、美国图书馆与信息资源委员会(CLIR)和英国联合信息系统委员会(JISC)。“数字信息长久的持续性存取对未来科学研究、教育和企业发展是必不可少的。”Lavoie博士说,“除了为保存数字信息开发良好的技术手段外,我们还必须保证我们的保存战略在经济上的可持续性。特别小组的工作将是在达成这一目标中迈出的重要一步。”这两位负责者将召集一个由杰出领导者组成的国际小组,为科学和工程、文化遗产、公共和私人部门起草有关数字信息在经济上的可持续发展的建议(93)

5.3.12 加强多方合作

(1)图书馆之间的合作

中国国家图书馆已与英国国家图书馆就交换图书出版信息和书目数据、数字资源永久保存的合作、英方为中方培训西文善本修复人员等议题进行了深入地讨论并达成初步意向。

(2)图书馆与档案馆之间的合作

德国的数字保存合作项目kopal的目标是:对用于数字资源的长期存档系统进行合作创建与运行的测试与执行,该系统将遵循长期保存的国际标准,元数据在OAIS框架内。该项目的合作者有:德国国家图书馆(Die Deutsche Bibliothek,简称DDB),Gottingen State and University Library(SUB Gottingen),IBM Deutschland GmbH and the Gesellschaft fur wissenschaftliche Datenverarbeitung mbH Gottingen(GWDG)(94)

美国国会图书馆和澳大利亚、加拿大、丹麦、芬兰、法国、冰岛、意大利、挪威、瑞典以及英国的国家图书馆、因特网档案馆(Internet Archive)一起组建了国际因特网保存联盟(International Internet Preservation Consortium,简称IIPC),该项目体现了国际上图书馆与档案馆之间的数字资源保存合作(95)

(3)图书馆与出版社的合作

前文所述的国际图联《永久保存世界记忆:关于保存数字化信息的联合声明》指出,“出版机构和图书馆工作小组将进一步开展有关数字信息保存方面相关的技术、经济和政策问题方面的合作,其中包括在合适的条件下成立与其他相关组织协同工作的统一机构”。(96)

(4)更广泛的合作

美国NDIIPP项目的参与者有OCLC、因特网档案馆、弗吉尼亚州立大学图书馆、亚利桑那与威斯康辛等5个州的图书馆联盟、伊利诺伊大学香槟分校图书情报学院、美国国家超级计算应用中心、马里兰大学Robert H.Smith商学院、联邦政府机构、公司等。在该项目中,美国最大的两个公共电视内容生产商——教育广播公司(Educational Broadcasting Corporation,简称EBC)与WGBH教育基金会(WGBH Educational Foundation,简称WGBH)和公共广播服务公司(Public Broadcasting Service,简称PBS)纽约大学合作,制定一个保存数字形态的公共电视节目的程序、结构与标准。

美国国会图书馆除了与NDIIPP参与机构合作外,在数字信息资源收集与保存领域还和LOCKSS等项目合作;其在数字信息保存技术工具和服务领域的合作对象还有:圣地亚哥超级计算中心(San Diego Supercomputer Center)和洛斯阿拉莫斯国家实验室;还与一些联盟开展合作,如LC是国际因特网保存联盟(IIPC)的发起者之一,还与数字图书馆联盟(Digital Library Federation,简称DLF)、美国国家档案与记录管理委员会(National Archives and Records Administration)、英国数字保存联盟(Digital Preservation Coalition,简称DPC)等开展广泛合作(97)

【注释】

(1)金更达.数字信息长期保存研究现状分析.[2008-01-05].http:// www.danganj.net/UpLoadFiles/Article/2007-7/2007073001093424492.doc

(2)UC Berkeley SIMS.How much information 2003.[2008-01-05]. http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/execsum.htm

(3)“拯救灾难数据无忧”DRS率先进入高端.[2008-01-05].http:// server.zol.com.cn/2004/0422/94877.shtml

(4)Linda Ashcroft.Long-term preservation of our digital assets is a step closer: report on first year's activity by Digital Preservation Coalition published[J].New Library World,2004,Vol.105,Iss.5/6:227

(5)曾蕾.数字保存Digital Preservation—For the Future of the Past.[2008-01-05].http://elib.lib.tsinghua.edu.cn:8080/meeting/ppt/zenglei1.pdf

(6)Library of Congress announces awards of$13.9 million to begin building a network of partners for digital preservation.[2008-01-05].http://www.loc.gov/ today/pr/2004/04-171.html

(7)Business plan archive.[2008-01-05].http://www.businessplanarchive.org

(8)Dot com archive.[2008-01-05].http://www.dotcomarchive.org

(9)Julie Sweetkind-Singer,Mary Lynette Larsgaard,Tracey Erwin.Digital preservation of geospatial data[J]Library Trends,2006,Vol.55,Iss.2:304-315

(10)Task ForceonArchivingofDigitalInformation,Commissionon Preservation and Access,Research Libraries Group.Preserving digital information: report of the Task Force on Archiving of Digital Information.Washington,D.C.: Commission on Preservation and Access,1996:2

(11)曾蕾.数字保存Digital Preservation—for the Future of the Past.[2008-01-06].http://elib.lib.tsinghua.edu.cn:8080/meeting/ppt/zenglei1.pdf

(12)It's about time:research challenges in digital archiving and long-term preservation.[2008-01-08].http://digitalpreservation.gov/about/NSF.pdf

(13)数字资源长期保存国际会议在国家科学图书馆举行.[2008-02-14]. http://www.cas.cn/html/Dir/2007/10/16/15/34/10.htm

(14)American memory.[2008-01-08].http://memory.loc.gov/ammem/index.html

(15)America's library.[2008-01-08].http://www.americaslibrary.gov/cgi-bin/page.cgi

(16)Exhibits.[2008-01-08].http://www.loc.gov/exhibits/

(17)Ohio memory.[2008-01-08].http://www.ohiomemory.org/

(18)Worthington memory.[2008-01-08].http://www.worthingtonmemory.org/

(19)California digital library.[2008-01-08].http://www.cdlib.org

(20)The digital services project.[2008-01-08].http://www.nla.gov.au/dsp/dspslide.html

(21)Gallica.[2008-01-08].http://gallica.bnf.fr

(22)Priority objectives for FY2007.[2008-01-08].http://www.ndl.go.jp/en/aboutus/vision_PriorityObjectives_FY2007.html

(23)e-Depot and digital preservation.[2008-01-08].http://www.kb.nl/e-depot

(24)数字图书馆正向我们走来.[2008-01-08].http://www.nlc.gov.cn/GB/channel55/58/200709/06/3987.html

(25)关于IDP.[2008-01-08].http://idp.nlc.gov.cn/

(26)IDP.[2008-01-08].http://idp.bl.uk

(27)数字敦煌.[2008-01-08].http://idp.nlc.gov.cn

(28)台湾大学典藏数位化计划.[2008-01-08].http://140.112.114.21/newdarc/darc/index.jsp

(29)UNESCO's Memory of the World Programme.[2008-01-08].http://portal.unesco.org/ci/en/ev.php-URL_ID=1538&URL_DO=DO_TOPIC&URL_SECTION=201.html

(30)东巴古籍入“世界记忆名录”.[2008-01-08].http://heritage.tom.com/1446/2003917-21024.html

(31)Minerva Prototype.[2008-01-08].http://www.loc.gov/minerva/

(32)PANDORA.[2008-01-08].http://pandora.nla.gov.au

(33)Allan Arvidson,Johan Mannerheim.The Kulturarw3 Project—The Royal Swedish Web Archiw3e—An example of“complete”collection of web pages.[2008-01-08].http://www.ifla.org/IV/ifla66/papers/154-157e.htm

(34)中国Web信息博物馆.[2008-01-08].http://www.infomall.cn/

(35)数字图书馆正向我们走来.[2008-01-08].http://www.nlc.gov.cn/GB/channel55/58/200709/06/3987.html

(36)Maintaining the permanent availability of the digital records of science.[2008-01-08].http://www.icsti.org/advocacy_statement.html

(37)JSTOR.[2008-01-08].http://www.jstor.org

(38)Practices and challenges in preservation and access for scientific and scholarly digital repositories DCC/DPE/DRIVER/Nestor joint workshop.[2008-01-08].http://www.wepreserve.eu/events/dr-2007

(39)Networking for digital preservation—current practice in 15 national libraries.[2008-01-09].http://www.ifla.org/V/pr/saur119.htm

(40)The state of digital preservation:an international perspective.[2008-01-09].http://www.clir.org/pubs/reports/pub107/pub107.pdf

(41)Anne A.Kenney and Deirdre D.Stam(2002).The state of preservation programs inAmericancollegeandresearchlibraries:buildingacommon understanding and action agenda.[2008-01-09].http://www.clir.org/pubs/ reports/pub111/contents.html

(42)DPC/PADI What's new in digital preservation.[2008-01-09].http:// www.dpconline.org/graphics/whatsnew/index.html

(43)Martha Kyrillidou(2002).State of preservation 2000-01.[2008-01-09].http://www.arl.org/stats/pres/imls/ala_0602_files/frame.htm,

(44)E-Journal archive DTD feasibility study.[2008-01-09].http://www.diglib.org/preserve/Hadtdfs.pdf

(45)Preserving the memory of the world in perpetuity:a joint statement on the archiving and preserving of digital information.[2008-01-09].http://www.ifla.org/V/press/ifla-ipa02.htm

(46)刘家真.拯救数字信息:数据安全存储与读取策略研究[M].北京:科学出版社,2004:31

(47)数字信息依赖于存储介质.[2008-01-09].http://www.cnki.net/webnews/view/display.php?page=2126&font=bigfont

(48)谁来拯救丢失的数据.[2008-01-09].http://www.dzwww.com/dazhongribao/shehuizhoukan/200403250244.htm

(49)刘家真.拯救数字信息:数据安全存储与读取策略研究[M].北京:科学出版社,2004:6

(50)郭瑞华.数字信息长期存取策略研究[J].情报理论与进展,2002(2):133

(51)徐义全.电子文件系列讲座之三:电子文件的特性[J].北京档案,2001(3):14-15

(52)蔡曙光.数字文献信息的保存——未来图书馆事业发展的前提和条件[J].大学图书馆学报,2002(3):14-18

(53)刘家真.拯救数字信息:数据安全存储与读取策略研究[M].北京:科学出版社,2004:104

(54)About ERPANET.[2008-01-11].http://www.erpanet.org/about.php

(55)Gregory W.Lawrence,William R.Kehoe.Risk management of digital information:a file moment investigation.[2008-01-11].http://www.clir.org/pubs/reports/pub93/contents.html

(56)Preserving digital information report of the task force on archiving of digital information.[2008-01-11].http://www.rlg.org/legacy/ftpd/pub/archtf/finalreport.pdf

(57)Digital preservation and records management programme.[2008-01-11]. http://www.jisc.ac.uk/whatwedo/programmes/programme_preservation.aspx

(58)Policies,strategies&guidelines.[2008-01-11].http://www.nla.gov.au/padi/format/policy.html

(59)陈清文.网络信息资源长期保存策略研究[J].情报杂志,2006(9):114

(60)CLDP.[2008-01-11].http://www.lboro.ac.uk/departments/ls/disresearch/CLDP/

(61)Adrienne Muir(2003).Copyright and licensing for digital preservation.[2008-01-11].http://www.cilip.org.uk/publications/updatemagazine/archive/archive2003/june/update0306c.htm

(62)Adrienne Muir.Digital preservation:awareness,responsibility and rights issues.Journal of Information Science,2004,volume 30,number 1:73-92

(63)Sharon E.Farb.Negotiating use,persistence and archiving:a study of academic library and publisher perspectives on licensing digital resources.A dissertation filed at the University of California,Los Angeles

(64)Sharon E.Farb.Libraries,licensing and the challenge of stewardship. First Monday,2006,vol.11,no.7.[2008-01-11].http://www.firstmonday.org/issues/issue11_7/farb/#author

(65)王志庚,赫守真.网络文献保存的实践和课题[J].国家图书馆学刊,2004(2):23-29

(66)永久保存世界记忆:关于保存数字化信息的联合声明.http:// www.ifla.org/V/press/ifla-ipa02-cn.pdf

(67)王志庚,赫守真.网络文献保存的实践和课题[J].国家图书馆学刊,2004(2):23-29

(68)CDL e-Scholarship.[2008-01-11].http://www.cdlib.org/programs/escholarship.html

(69)cedars Homepage.[2008-01-11].http://www.leeds.ac.uk/cedars

(70)宛玲.国外数字资源长期保存的最新发展及对我国的启示[J].中国图书馆学报,2004(2):22-26

(71)Johan Mannerheim.The WWW and our digital heritage—the new preservation tasks of the Library Community.66th IFLA Council and General Conference Proceedings.[2008-01-11].http://www.ifla.org/IV/ifla66/papers/158-157e.htm

(72)赵俊玲,卢振波.网络信息保存的责任体系分析[J].大学图书馆学报,2006(2):94-97,88

(73)Preservingyourdigitalmemories.[2008-01-13].http://www.digitalpreservation.gov/you/digitalmemories.html

(74)Bruce W.Dearstyne.Effective approaches for managing electronic records and archives.Final Recommendations of the Digital Preservation Testbed on the Long Term Preservation of Emails and Animation on Email Preservation.Lanham,Maryland:Scarecrow Press,Inc.,2002

(75)Susanne Dobratz,Frank Scholze.DINI institutional repository certification and beyond[J].Library Hi Tech,2006,Bradford,Vol.24,Iss.4:583

(76)Portico.[2008-01-13].http://www.portico.org/

(77)George,Gerald W.Difficult choices:how can scholars help save endangered research resources?[J].CLIR pub58,1995

(78)Randall C Jimerson.Deciding what to save OCLC systems and services[J].Bradford,2003,Vol.19,Iss.4:135-141

(79)Research Libraries Group,Inc.Trusted digital repositories:attributes and responsibilities,an RLG-OCLC report.[2008-01-13].http://www.rlg.org/legacy/longterm/repositories.pdf

(80)数据灾难,究竟离我们有多远.[2008-01-13].http://www.drs.infosec.org.cn/4news/100120/1755.html

(81)数据灾难,究竟离我们有多远.[2008-01-13].http://www.drs.infosec.org.cn/4news/100120/1755.html

(82)刘家真.拯救数字信息:数据安全存储与读取策略研究[J].北京:科学出版社,2004:168

(83)Library of Congress Archive Ingest and Handling Test(AIHT)Final Report.[2008-01-14].http://www.digitalpreservation.gov/library/pdf/ndiipp_aiht_final_report.pdf

(84)Version 0.2 of the technical architecture.[2008-01-14].http://www.digitalpreservation.gov/library/pdf/NDIIPP_v02.pdf

(85)PREMIS working group publishes data dictionary for preservation metadata; final product of consensus-building effort jointly sponsored by OCLC and RLG.[2008-01-14].http://www.oclc.org/asiapacific/zhcn/research/announcements/2005-05-20.htm

(86)Toshiyuki Goto.Preservation metadata:current situation and future perspectives[J].Journal of Information Processing and Management,2007,vol. 50,no.2:74-86

(87)Data dictionary for preservation metadata.[2008-01-14].http://www.oclc.org/research/projects/pmwg/

(88)Metadat amapping spreadsheet.[2008-01-14].http://wwwdigitalpreservation.gov/library/pdf/jhu_AIHTtoMETSmapRev5-05.xls

(89)ISO archiving standards.[2008-01-14].http://ssdoogsfc.nasa.gov/nost/isoas/

(90)PANDORA,Australia's web archive.[2008-01-14].http://pandora.nla.gov.au/index.html

(91)NEDLIB:Networked European Deposit Library.[2008-01-14].http://www.exploit-lib.org/issue4/nedlib

(92)A metadata framework to support the preservation of digital objects.[2008-01-14].http://www.oclc.org/research/projects/pmwg/pm_framework.pdf

(93)Panel to address economic sustainability of digital preservation.[2008-01-14].http://www.oclc.org/asiapacific/zhcn/news/releases/200673.htm

(94)Reinhard Altenh9ner.Data for the future:The German project“Cooperative development of a long-term digital information archive”(kopal).Library Hi Tech,2006,Vol.24,Iss.4:574

(95)International Internet Preservation Consortium.[2008-01-14].http://www.netpreserve.org/about/index.php

(96)永久保存世界记忆:关于保存数字化信息的联合声明.[2008-01-14].http://www.ifla.org/V/press/ifla-ipa02-cn.pdf

(97)Index of Partners.[2008-01-14].http://www.digitalpreservation.gov/partners/list.html

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈