首页 理论教育 数字信息资源建设与服务的标准保障体系

数字信息资源建设与服务的标准保障体系

时间:2022-03-10 理论教育 版权反馈
【摘要】:数字信息要在多个语种、多种格式、多种媒介、多种系统的环境中有效运行,就要制定统一的标准体系。我国数字信息标准建设起步较晚,但发展较快。信息创建标准是对信息格式的最基本规定,主要包括内容编码标准、数据格式标准和资源标识标准。资源描述标准主要指元数据,这是标准体系中最为丰富的组成,针对不同的描述对象和应用领域出现了各种元数据标准。

10.3 数字信息资源建设与服务的标准保障体系

数字信息要在多个语种、多种格式、多种媒介、多种系统的环境中有效运行,就要制定统一的标准体系。标准是指在数字信息制作、处理、传输和服务过程中必须遵循的规则,它是数字资源存储、访问和管理过程中的关键因素,可以保证异构信息系统之间的兼容性、可用性和互操作性,促进信息资源的共享(41)

10.3.1 我国数字信息标准建设的现状

我国数字信息标准建设起步较晚,但发展较快。中国试验型数字图书馆、中国数字图书馆工程、中国高等教育文献保障系统、中国科学院国家科学数字图书馆、上海数字图书馆、北京大学数字图书馆等已经完成和正在实施的各种规模的数字信息资源建设项目和数字信息服务在各个环节上注重借鉴、试验和推行国际、国内和事实标准,并结合中文信息的特点开始研究适合我国数字信息建设情况的标准体系。

国家图书馆主导建设的中国试验型数字图书馆项目和中国数字图书馆已制定了《中国数字图书馆资源加工标准规范建议》、《中国数字图书馆标准指导》和《中文元数据标准》,建立了自己的元数据方案并进行了实例描述(42)。中国高等教育文献保障系统(CALIS)管理中心编制了《CALIS子项目建设技术标准与规范》,在此基础上,CALIS各子项目组又根据自身需求陆续制定了子项目的专用技术标准与规范,如《资源选择与评估标准》、《网络资源元数据规范》、《网络资源元数据描述著录规则》、《资源类型控制表》(43)。2004年8月至10月,CALIS管理中心对各子项目标准重新进行修订和增补,编辑成为《中国高等教育数字图书馆技术标准与规范》(44)。中国科学院国家科学数字图书馆(CSDL)对分布式信息环境中数据的开放描述进行集中研究,形成了系列研究报告:《数字图书馆建设的标准规范体系》、《数字图书馆的开放元数据机制》、《数字图书馆环境中异构系统的开放封装问题》、《数字图书馆数字对象唯一标识符问题》、《数字图书馆资源集合元数据的发展与应用》、《数字图书馆管理元数据的发展与应用》、《数字图书馆元数据开放登记系统》。基于这些研究报告,根据数字图书馆建设实际和发展趋势,制定了《国家科学数字图书馆开放描述与标准应用指南》,提出了CSDL实施开放描述的具体原则、方法和操作要求。北京大学数字图书馆研究所主要研究古籍数字图书馆、元数据标准体系、数字图书馆总体模式、数字化标准、数字资源建设等内容,于2001年制定了《中文元数据标准框架》,在此基础上,建立了古籍、拓片、舆图元数据标准研究示范数据库。

虽然我国数字信息标准化取得了很大进展,但由于长期以来标准化基础薄弱,标准意识不强,所以总体上数字信息标准化还比较落后、混乱,存在着一些问题,表现在:①标准建设滞后,在资源建设之初往往忽视统一标准的确立,而是在资源规模发展到一定程度才开始关注和制定标准,造成早期投入的浪费。②标准内容体系不完善,数字信息的数量、类型、内容越来越复杂,相对而言标准建设还比较缓慢,很多方面还没有制定相应的标准。③标准研制各自为政,缺乏有效的合作。④标准选择缺少规范。数字化项目适用什么样的标准及如何适用等问题完全交给最终实施数字化的机构来解决,而没有一个机构居中协调。⑤国际兼容性较差。我国较少参与到国际标准的制定过程中,跟踪最新成果不及时,导致国内标准与国际标准不能接轨。总之,我国数字标准还需要确立正确的建设思路,加强开放性,加快发展。

10.3.2 数字信息标准的内容体系

数字信息建设和服务要经历资源转换、加工、创建到资源描述、组织、存储,到资源发布、检索、存取,再到资源保存、服务的整个流程,构建完备的标准体系就要贯穿整个过程,保障各个环节的工作都能做到标准化。总的来说,数字信息建设和服务涉及的所有标准可划分为五个层次:资源创建标准——数据编码标准、文件格式转换标准、对象标识标准;资源描述标准——元数据标准、文献结构化编码标准;资源组织标准——资源集合管理标准、开放链接标准、数字对象调度标准;资源长期保存标准——信息长期保存协议标准、资源获取标准;资源服务标准——检索协议标准、参考服务标准(45)

(1)信息创建标准

信息创建标准是对信息格式的最基本规定,主要包括内容编码标准、数据格式标准和资源标识标准。内容编码标准分为字符编码标准、特殊信息编码标准和结构化信息编码标准。其中,特殊信息编码标准指涉及数学符号和公式、化学符号、矢量信息、地理坐标等的编码标准,它们遵循基于XML的开放置标语言,如数学数据标准MathML、化学信息标准CML、矢量数据标准SVG、地理信息标准GML等(46)。结构化信息编码标准的典型是标准通用置标语言SGML及扩展置标语言XML,为创建结构化、可交换的电子文献数据库提供了依据。

数据格式标准是指文本、图像、音频、视频等数据内容的格式规定,主要有PDF、PS、HTML、XHTML或XML文本格式;BMP、XBM、PCX、GIF、JPEG、TIFF以及适应Internet的图像格式PNG等图像格式;MP3、DAT、MIDI、WAVE、AIFF、Apple QuickTime、SUN Audio和MS RealAudio等音频格式;MPEG、Apple QuickTime、MS Real Video、Flic、Microsoft AVI、Microsoft ASF、RealMedia、DV、DVCam、DVCPro、DigiBeta等视频格式标准。

资源标识对于建立一个有序的数字化信息保障体系来说非常重要,一个永久的唯一标识符能够指向资源而不管其位置,在资源位置变动时通过映射来保证与当前位置一致。主要的资源标识标准包括统一资源标识符URL、统一资源名称URN、统一资源特征URC、句柄系统the Handle System、数字对象标识符DOI、永久性统一资源定位符PURL。

(2)信息描述标准

资源描述标准主要指元数据,这是标准体系中最为丰富的组成,针对不同的描述对象和应用领域出现了各种元数据标准。例如:艺术作品描述标准CDWA、编码档案描述标准EAD、地理数据描述标准FGDC/CSDGM、政府信息定位服务标准GILS、电子文本编码与交换标准TEI、视觉资料描述标准VRA Core、学习对象元数据标准LOM。探讨最多的是MARC标准、DC标准和RDF标准。MARC是使用最成熟且应用最广泛的存储和交换书目记录的标准,遵循ISO2709规定,用字段来描述信息的不同特征。DC元数据是为了描述网络资源、支持网络检索而建立的简单有效的元数据模式,它简练、易于理解、扩展性强,能较好地解决网络资源的发现、控制和管理问题。RDF即资源描述框架,能对结构化元数据进行编码、交换及再利用。它本身只有很少的语义定义元素,但通过对通常意义上的语义、语法和结构的支持,可使不同用户定义自己的元数据元素,提供不同元数据体系之间的互操作性。

(3)信息组织标准

信息组织最基本的标准是分类法和主题法。通用的分类法主要有:《中国图书馆分类法》、《中国科学院图书馆图书分类法》、《中国人民大学图书馆图书分类法》、《中国图书资料分类法》、《中国档案分类法》、《杜威十进分类法》、《美国国会图书馆分类法》、《国际十进分类法》、《冒号分类法》、《布利斯书目分类法》。通用的主题法主要有:《汉语主题词表》、《美国国会图书馆标题表》等。此外,针对各种专门学科信息,还有很多专用的词表,包括: INSPEC叙词表(INSPEC Thesaurus)、图像元素叙词表(Thesaurus for Graphic Materials)、地名叙词表(Thesaurus of Geographic Names)、医学标题表(Medical Subject Headings)、艺术和建筑叙词表(Art and Architecture Thesaurus)等(47)

(4)信息长期保存标准

数字信息保存方面的相关标准有:美国研究图书馆组织(RLG)提出的数字资源长期保护的问题框架,美国空间数据系统咨询委员会(CCSDS)提出的OAIS模型等。其中OAIS已被普遍接受为数字信息长期保存系统基本架构,已作为ISO 14721:2000标准。它提供了一个功能框架和一个信息框架,前者包括摄取模块、长期存储模块、数据管理模块、检索传递模块和系统管理模块,后者包括通过摄取模块获得的存交信息单元、经过处理后用以存储的存储信息单元、检索时提交的传递信息单元。通过这两个框架信息,OAIS模型提供专业术语和观念用于描述和比较资源库的结构和运作,定义开放档案信息系统的职责,提供具体的模式用于操作、组合和处理程序,支持数字信息的长期保存和查询(48)。目前OAIS已在众多图书馆的数字信息保存项目中得到应用,如CEDARS、PANDORA、NEDLIB(49)

(5)信息服务标准

信息服务标准主要体现在信息检索标准/互操作标准Z39.50、OAI协议以及虚拟参考咨询规范。Z39.50协议是一个基于客户机/服务器的信息检索标准,它规定了一些过程和格式,支持计算机使用一种标准的、相互可理解的方式进行通讯,并支持不同数据结构、内容、格式的系统之间的数据传输,实现跨平台异构系统之间的互联与数据库查询(50)。Z39.50协议具有丰富的语义、良好的互操作性和强大的功能,但由于它的应用主要基于MARC标准之上,MARC格式字段重复、结构繁琐、数据处理要求高使得Z39.50协议繁杂而难以实现多种类型的数据查询(51)

OAI的全称是开放文档先导(Open Archive Initiative),是基于元数据采集的网络数据库系统互操作协议,它以Dublin Core的15个核心元素为“中间件”,使不同元数据方案下相等或近似相等的元数据相互映射,以实现语义上的互操作(52)。目前OAIS正以其低进入障碍,获得越来越广泛的应用,如美国记忆、伦敦档案和CALIS的高校学位论文全文数据库。

对于虚拟参考咨询服务,各种机构都提出了服务规范,包括IFLA参考咨询专业委员会的《IFLA数字参考咨询指南》、美国参考咨询与用户服务协会的《虚拟参考服务实施与维护指南》、《Question Point成员指南》、美国教育部及其所属的教育资源信息中心的《K-12数字参考服务信息咨询专家指南》、美国国家信息标准组织推出的技术标准之一《问题/答案流程处理协议》、虚拟参考咨询项目组制定的QuIP(《问题交换协议》)和AnswerBase公司设计的KnowledgeBit(53)。其中,《Question Point成员指南》比较通用。国内虚拟参考咨询服务规范中具有代表性的是《CALIS虚拟参考咨询服务规范》。它由CALIS分布式联合虚拟参考咨询系统(CVRS)项目管理小组负责,北京大学图书馆起草,2005年开始试用,包括虚拟参考咨询概述、素质规范、行为规范、咨询流程规范和答案质量规范等内容并附有一些咨询案例(54)

10.3.3 数字信息资源建设与服务标准保障体系建设的思路

(1)树立正确的标准意识

加强标准工作的首要前提是提高标准化意识,要充分认识到标准化对于数字资源共建共享的重要性,纠正对标准化的片面认识。一方面,要认识到标准化是实现数字资源共享的前提,是数字信息长期保存和使用的基本保证。在资源建设中首先要考虑标准化问题,而不能只满足于资源的建设规模和自建自用的应用要求,也不要在资源建设到了一定阶段遇到实际困难时才考虑标准化问题。另一方面,要处理好“自有标准”和“统一标准”间的平衡,不能将个性化等同于“自有标准”,但也不能将标准化等同于“大一统”,而要以开放的思想来达到个性化和统一性的最佳结合(55)

(2)加强标准制定的合作与协调

我国信息标准制定各自为政、重复建设现象严重,解决问题的合理方式应该是由一个机构牵头,根据数字信息资源建设特点和标准化总体要求,统筹规划,制定适应不同资源和使用目的的标准化发展策略、标准整体框架、具体标准体系,以加强标准的整体协调和资源的互通,最大限度地减少标准失误。我国近来注意到了这一问题,2002年5月,“中国数字图书馆工程标准规范论坛”在北京举行,来自高校、科研院所和公共图书馆以及信息企业的代表参会并就数字图书馆标准规范体系建设达成“联合、开放、公开”的共识(56)。由中国科技信息研究所、中国科学院文献情报中心和中国国家图书馆共同开展的“我国数字图书馆标准规范建设”项目也于2002年10月正式启动,采取联合、开放、共享方式,开始了我国标准制定的总体协调。

(3)完善数字信息标准的内容体系

数字信息建设发展迅速,从建设模式、资源内容、资源类型和数量等方面都发生了巨大的变化,这使信息建设的内容愈加复杂,对于标准的要求也更趋于精细、完备,因此完善数字信息标准内容不可或缺。在此过程中,要注意两个方面:第一,将标准建设的长期目标和近期目标结合,使标准内容既能满足现实需求,又能循序渐进、逐步完善。第二,注意将标准的宏观框架和具体业务标准建设结合,使标准体系既能提供整体性指导,又能提供具体业务中可操作的规则和细则。

(4)确定数字信息标准的选择策略

在目前数字信息建设中,虽然有些方面的标准还不完备,但就解决某一类技术或问题而言,有时标准往往存在几个。此外,标准具有适用性,同类型的标准有各自不同的优势,适用于不同的情况,而且同一标准也要不断进行更新和调整。因此,在何种情况、何种时间采用哪种标准以及如何使用都需要慎重考虑,这其中就涉及确定标准的选择策略。在确定具体标准的选择策略时,要坚持整体最优、统一实用、协商一致、便于扩充等原则;应当注意标准的国际化、开放性和技术成熟度;适当采用事实标准;适当进行标准选择的经济评估(57)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈