首页 理论教育 电子文件的保存

电子文件的保存

时间:2022-02-28 理论教育 版权反馈
【摘要】:电子文件类型的丰富与复杂在一定程度上增加了其保存的难度。电子文件保存的基本要求要服从于电子文件管理的基本目标,即保证电子文件的真实、完整、可靠、可用。封装是将电子文件以及有关的元数据以信息包形式保存起来的方法。封装信息包既能够保存电子文件的存储格式,以及封装本身使用的格式;也能描述电子文件保存历史及其与其他电子文件的关联,还可以通过比对元数据描述与电子文件是否相符来验证电子文件在封装时是否被修改。

1.非直读性

电子文件是以数字化信息形态存在的,它在物理介质上的存储形态完全不同于其逻辑显示,必须依靠相应的读取、显示等软硬件设备。

2.软硬件过时

信息技术硬件设备和软件产品多以2~5年的周期更新换代,因此电子文件的生成、读取、存储、检索手段变更迅速。需要对技术变革可能产生的各种冲击进行评估预测,甚至在文件创建之前就通过各种措施来缓解软硬件过时导致的不利影响。

3.载体脆弱

传统的档案载体,从甲骨金石到简帛纸张,在保存环境适当的情况下都能做到长久保存,以至于有“纸寿千年”的说法。但新型载体在设计和生产时并未对其持久性做充分考虑,其保存寿命都远远短于纸张,同时载体本身对其生产原材料、设备、软件、驱动程序的依赖,导致所保存的电子文件无法读取。

4.类型复杂

电子文件类型的丰富与复杂在一定程度上增加了其保存的难度。由于类型不同,保存的技术方法可能存在巨大差异,尤其涉及技术更新时更是如此,如数据库、GIS信息、三维设计图等复杂类型的文件。

电子文件保存的基本要求要服从于电子文件管理的基本目标,即保证电子文件的真实、完整、可靠、可用。具体而言,基本要求包括:

1.载体有效性

载体有效性是电子文件保存的最基本要求,要求保证电子文件载体的足够安全,因此需要对载体的物理特性、技术规格、使用方法和保护措施等有详细的了解与掌握,以便于进行有效维护。然而由于电子文件载体的寿命有限,且升级换代频率加快,需要采用适当的技术方法保护文件载体的有效性,例如必要的更新和迁移操作等。

2.信息可用性

可用性是指电子文件能够通过现有的软硬件技术,以人可以接受的方式展示相关信息。可用性要求电子文件保存系统能够对所保存的二进制内容进行转换,并准确地恢复原貌,以人们能够直观理解与习惯阅读的格式进行还原显示,如显示在屏幕上的文本与图像,或是通过计算机播放的声音或视频等。

电子文件可用性并不强求用其原始的生成环境来再现,事实上经过一定时期保存的电子文件,其原始的软硬件环境大多已不存在。一般来说,能够通过其他第三方工具实现信息再现,即使其呈现形式与原始形式有所差异,但只要该差异不影响对文件信息真实性的判断都是可以接受的。

3.信息可理解性

可理解性是指电子文件的信息能够按照其本身的意图被正确理解。它是信息可用性的深化要求,是语义层面上的要求。只有那些能被人理解并且表达正确的文件才能够提供利用,然而对一份具体文件的内容而言,常有不被人理解的地方,这就需要结合其关联文件、元数据描述、背景注释等信息的辅助。

1.更新

更新是在新载体上拷贝电子文件信息来替换旧载体的方法,也称载体更新。

2.迁移

迁移是随技术变化转换数据的一种处理过程,可使数据从某一硬件或软件配置向目标硬件或软件配置转换。简单地说,迁移就是不同信息格式之间的转化,很多时候还涉及整个系统配置的改变,视具体的信息类型而定。其目的在于保护数字信息的完整性,针对不断的技术进步,保留用户对数字信息的检索能力、显示能力与使用能力。

3.仿真

仿真就是在新的系统环境下重建一个兼容原始数据、设备及其管理系统的运行环境,使得原来的数据、设备和系统能在现行的软硬件系统上运行。仿真实际上是通过模拟电子文件形成时的原始环境来保障数字信息内容的可利用性。

4.封装

封装是将电子文件以及有关的元数据以信息包形式保存起来的方法。封装信息包既能够保存电子文件的存储格式,以及封装本身使用的格式;也能描述电子文件保存历史及其与其他电子文件的关联,还可以通过比对元数据描述与电子文件是否相符来验证电子文件在封装时是否被修改。

1.制定相关标准体系

数字信息资源长期保存是一项复杂而又艰巨的工作,数字信息资源长期保存的每一个环节都需要标准的支持。目前,由于数字信息资源长期保存标准的多样性和复杂性,尚无公认的数字信息资源长期保存的标准体系框架。从已有的研究来看,基本共识是在OAIS参考模型的基础上设计标准体系。

2.确定信息保存技术方案的基本策略

严格来说,目前并没有非常理想的信息保存技术方案,尤其是长期保存的技术方案。单靠个别的技术方法是远远不够的,因此需要在良好的管理基础上,综合多种方法来共同实施。

3.协调文件生命周期各阶段的长期保存职责

电子文件保存是涉及文件生命周期所有参与者的管理活动,在文件生命周期的每一个阶段都应考虑到保存问题,因而每个阶段的参与者都可被视为信息保存的责任者。在电子文件生成阶段,数字信息的形成者应选择适当的文件格式,以保证其长期存取性能;在电子文件流转、管理阶段,信息的管理者有可能采取加密、格式转换、压缩、权限管理等措施,这些措施对日后该文件保存的影响应有相应评估与对策;在文件的归档保存阶段,文件保管者应综合采取各种长久存取的方法以确保信息在其保管期限内的可读性。

4.选择符合长久保存策略的格式

目前已有部分国家出台了格式管理方面的规范,我国也颁布了档案行业标准《版式电子文件长期保存格式需求》(DA/T 47—2009),标准没有指定具体可用的格式,而是以版式文件为例对如何选择格式提出了要求。具体内容包括:

(1)格式开放,即要求有公开发表的相应标准和技术规范、没有专利和许可的限制、厂商中立、有与产品无关的专家组、标准化组织和产业联盟等维护和支持该格式等。

(2)不绑定软硬件,即能被多种操作系统和硬件平台支持、文件的阅读不依赖于特定的阅读软件。

(3)文件自包含,即文件呈现的全部信息完全自包含、文件的显现不依赖于外部对象、文件中应包括全部字体的字形描述信息或嵌入字体程序信息等。

(4)格式自描述,即格式应设置规范的元数据集,用于描述文件和对象的属性特征、文件中应声明遵循的格式标准和版本等。

(5)显示一致性,即固定显示文件页面、章节、段落、字体、色彩等,不因软硬件平台和阅读软件变化而变化。

(6)持续可解释,即允许用户对文件和文件中的对象添加注释。

(7)稳健,文件格式稳定,版本升级更新有序,前后兼容。不采用有损压缩、子采样、缩减采样或者其他任何有可能改变文件内容或降低原始数据质量的操作。

(8)可转换,即支持其他格式转换为版式电子文件长期保存格式、支持过时的版式电子文件长期保存格式转换为新的版式电子文件长期保存格式。

(9)利于存储。

(10)支持技术认证机制,即支持数字签名。

(11)易于利用。

5.选择合适的电子文件的保存载体

在选择载体时,应重点考虑如下因素:

(1)载体寿命。是指对所保存数据有效保存时间长度。在此期间,电子文件数据可以保证其完整准确。

(2)性能与成本。应就存储密度、存储容量、存取速度等载体性能指标进行综合评价。一般而言,存储密度越高,存储容量就越大,就越有利于降低存储空间和存储成本。各机构在选择载体时应结合自身实际,根据需要存储的数据容量选择,并使载体的实际数量可控。

(3)标准。载体的规格(包括载体的几何尺寸、存储密度、奇偶校验等)、信息记录在载体上的文档识别方式、记录方法等应遵从国际和国家标准,载体及其支持的硬件和软件最好应基于成熟的但不一定是领先的技术。

(4)良好的保护性能。载体应具备公认的、稳定的、持久的性能,允许用户方便地确定载体对各种因素影响的反应,如温湿度变化、污染物的影响等;允许用户较容易地检测载体的质变,发现载体存在的问题。介质还应该具备物理损坏低敏感性,允许较为宽容的保管条件。如磁介质应该有高矫顽力值,以尽量降低外部磁场导致数据丢失的风险。

(5)载体检测技术。载体在读取和写入数据时应支持较为健壮的错误检测方法,如提供介质写操作后的完整性检测,当发生数据丢失时可使用有关的数据恢复技术。用于归档或长久保存的载体尽量一次性写入,或者有一种可靠的写入保护机制,以防止意外的删除,以充分维护数据的完整性。

6.严格遵循介质载体保护的要求

(1)磁介质载体的保护要求

第一,控制适宜的温湿度。温湿度是影响电子文件载体耐久性的重要因素,因此要保证库房温湿度的相对稳定。根据《磁性载体档案管理与保护规范》(DA/T15—1995)的规定,应在温度15~27℃、相对湿度40~60%的范围内选定一组值,推荐最佳保管温度为18℃,相对湿度为40%。

第二,防止外来磁场。磁性载体是依靠剩磁强度来进行信息的记录和重放的,因此需要尽量杜绝外来磁场造成的影响。外来磁场作用于磁性载体上,能使磁性涂层的剩磁发生消磁或磁化,造成信号失落或信噪比降低,破坏记录信息。在电子文件保存和使用过程中,磁性载体与磁场源(永久磁铁、马达、变压器等)之间应保持一定的距离;可使用软磁物质(软铁、镍铁合金等)制成箱柜,对磁场进行屏蔽;在存有重要电子文件的库区设置测磁设备,以检测隐蔽的磁场。

第三,防止灰尘。灰尘的影响对电子文件载体危害极大,它可以造成电子文件载体的物理损伤、化学损伤和生物损伤。灰尘污染或划伤磁盘、磁带表面,会造成其物理损伤,引起记录信息的损失;灰尘中所含的化学成分,会不同程度的引起磁腐蚀、降解等化学作用而毁坏电子文件。

第四,防止机械震动。机械磨损和强烈震动,也能对电子文件产生破坏。磁盘、磁带在驱动器内高速运行,长期使用会使它们摩擦损伤,使记录信息丢失。

第五,避免强光。强光尤其是紫外线对磁性载体有很大的破坏力。它能与电子文件制成材料发生氧化反应,使磁盘、磁带的盘基、带基老化,脆性增大,强度下降;同时,紫外线的能量足以破坏磁性载体的剩磁的稳定性,导致信号衰减,影响磁性记录信息的读写效果。因此需要做好防光工作,要严防强光的影响,不要让室外光线直接照射在磁带上。

(2)光盘载体的保管要求

第一,控制温湿度。光盘应保存在低温干燥、恒温恒湿的环境中。在适宜的温湿度条件下,光盘老化衰老比较缓慢,但在高温高湿环境下,会加速光盘材料的化学反应速度,造成记录层燃料褪色、反射层氧化、盘基变形等现象。根据《电子文件归档光盘技术要求和应用规范》(DA/T 38—2009),光盘适宜的保存、工作环境的温湿度参考值如表4-1所示。

表4-1 光盘保存、工作和检测的温湿度条件

第二,避免盘面损伤。光盘盘面的平直度是影响光盘数据读出的重要因素,为避免盘面损伤,应注意使用习惯和环境卫生,防止灰尘等异物对盘面的划伤,防止人为不当接触导致的机械损伤。

第三,保证光盘刻录质量。光盘的刻录质量是光盘数据耐久性的重要保证。光盘刻录应选用经检测性能优良的光盘刻录机,数据刻录工作环境应符合温湿度的基本要求,刻录前光盘应在工作环境中放置2小时以上。归档数据刻录时应采用中速刻录,即CD-R光盘采用24~40倍速刻录速度,DVD(R光盘采用8~12倍速刻录速度,并采用全盘一次刻完方式。

第四,及时检测。电子文件保存机构或部门建立定期检测制度,监控已归档光盘的关键技术指标,适时实施光盘的数据迁移。

第五,加强日常管理。光盘在长期的使用过程中必须注意日常管理活动中的细节。首先是尽量减少使用;其次是养成正确的使用习惯,保存光盘时应垂直置放;不使用的光盘保存在串轴盒或光盘盒内;禁止使用刻录机读取光盘等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈