首页 理论教育 数字信息资源与服务整合的层次和内容

数字信息资源与服务整合的层次和内容

时间:2022-03-10 理论教育 版权反馈
【摘要】:它是指按照统一的标准和原则,将各种数据库的功能和结构进行优化组织,整合并集成在统一的信息服务平台之中,以便为信息用户提供异构数据库的跨库检索和利用。逻辑整合又称为虚拟数据库整合、系统平台整合、数据聚合、数据互操作,是一种通过建立中间件整合数字信息资源的二次信息,并通过构建统一的检索系统对分布式异构数据库进行自定义映射,以查询、利用的数字信息资源。

8.2 数字信息资源与服务整合的层次和内容

数字信息资源与服务整合是数字信息资源与服务优化组合的一种存在状态,是依据一定的需要,对各个相对独立的数字信息资源系统中的数据对象、功能结构及其内容关系进行融合、类聚和重组,重新结合为一个新的有机整体的过程。因此,数字信息资源的整合程度直接关系到数字信息资源的利用程度,也关系到数字信息服务的方式和途径。理想的数字信息资源整合是将各种信息资源按其内容的关联程度进行无缝式的链接与聚类,从而形成数字信息资源利用的保障体系,让信息用户在十分方便的网络环境中自由地获取和使用这些数字信息资源,而感觉不到他所操作和利用的所有数字信息资源分布在不同的数据库。这种理想的数字信息资源整合是信息资源开发、组织和管理所追求的目标,也是提高数字信息资源服务质量的重要前提。

8.2.1 数字信息资源与服务整合的层次

数字信息资源与服务的整合是有层次的,这种层次主要表现在:第一,数字信息资源整合的层次应与用户的信息需求层次相对应,进行多种类型、多种层次、多种方式、多维的整合。第二,体现数字信息资源整合与服务阶段的层次性,即在应用统一的硬件及软件平台对分布式数据整合的基础上,构建统一平台,实现多个机构的数字信息资源与服务的整合,从而形成有机的整体。

从数字信息资源与服务整合的研究与组织形式来看,整合大体可以设计两个层面,即物理层次的整合与逻辑层次的整合。

数字信息资源与服务的物理整合主要形式是数据仓库式整合。它是指按照统一的标准和原则,将各种数据库的功能和结构进行优化组织,整合并集成在统一的信息服务平台之中,以便为信息用户提供异构数据库的跨库检索和利用。通常情况下,这种整合主要是将多个运行相同应用的数据库平台合并到一台大的服务器上,简单来说就是“同类项合并”。数字信息资源的物理整合可以从多个内容相关的、物理和逻辑上都相互独立的数据源中提取面向主题的数据集合。统一的整合平台,使数字信息资源进行物理转换与格式化,并完成重新排列,提供信息用户的检索和利用,这是数字信息资源物理整合的主要目的。数字信息资源物理整合的特点是:数据物理地集成于本地,而集成数据与操作型数据相分离,原来分散的数据库系统仍然可独立地提供检索服务,因而是一种实现异构数据源的集中式管理、集中式存储的整合。如中国农业大学图书馆利用全球著名的数据库提供商Ovid Technologies提供的Ovid平台,整合了300个数据库,1 000种权威期刊及其他资源,并通过信息资源间的无缝链接为信息用户提供数字化信息资源检索与利用的窗口。浙江大学图书馆也在OVID平台上整合了LWW医学电子期刊全文、Journals@Ovid科技生物医学全文期刊、PsycINFO心理学期刊、ERIC教育学书目及摘要索引、CAB Abstracts、Agricola、AGRIS、Fsta(Food Science and Technology Abstracts)、BIOSIS Previews、Ovid MEDLINE(R)等银盘数据库(1)。这种方式的优点在于为用户提供一个单一、透明的数据使用环境,查询速度快,数据质量高,但却存在占用大量的存储空间及数据的获取具有一定的时滞性等问题。数字信息资源的物理整合通常适合于系统内部的各种数字信息资源整合,对于无隶属关系的部门之间的数字信息资源整合,无论技术上还是管理上有较大的障碍

逻辑整合又称为虚拟数据库整合、系统平台整合、数据聚合、数据互操作,是一种通过建立中间件整合数字信息资源的二次信息,并通过构建统一的检索系统对分布式异构数据库进行自定义映射,以查询、利用的数字信息资源。数字信息资源的逻辑整合的特点是深入信息内容之中进行虚拟的逻辑的整合,实现数字信息资源的“逻辑集中,物理分散”。借助中间件和遵从相关检索协议是实现数据逻辑集成的两种主要方式。尽管这些数字信息资源处于原来的分布状态,但逻辑上的管理机制和控制结构屏蔽了异构数字信息资源系统间的差异,使信息用户可一次集成检索多个数字资源系统。因此从用户的检索界面上来看,数字信息源被完整地整合在一个统一整体之中。数据逻辑集成的优点在于,所获数据与异构物理数据库的数据之间没有时滞,保证了数据的新颖性和时效性。但是逻辑整合方式同时也存在明显的不足,其主要表现为逻辑整合的是数字信息资源的二次信息,各种异构的数字资源并没有被整合,因此,受数字信息内容的关联程度及有效揭示的影响,信息用户的利用途径和方式往往受到很大的限制。

8.2.2 数字信息资源与服务整合的内容

数字信息资源整合的内容主要为:信息技术整合、数据资源的整合、数据库的整合、数字信息服务的整合。

(1)信息技术整合

信息技术整合是将各类型整合和综合利用数字信息资源的信息技术进行集合,所产生的技术群被称为信息资源整合技术。在数字时代,信息资源的整合是建立在信息技术之上,伴随着信息技术的发展而发展的。由于数字信息资源本身带有很强的技术性,没有信息技术的应用就不可能把异构的数字资源整合为一体化的知识体系,没有信息资源整合技术也不可能实现不同信息之间的转换、映射与互操作,更不可能进行数字信息资源的开发与利用。因此,数字信息资源的整合首先就集中体现在信息技术的综合运用上。数字信息资源的整合开发要求充分运用信息技术对数字信息资源保障体系进行优化和规范,从而简化服务流程,缩短服务距离,为信息用户提供简便、快捷、统一的运行界面和数字信息资源利用途径。信息技术整合的主要作用是有效地解决信息孤岛问题,实现跨网络、跨平台、跨应用、异构数据和其他信息整合。进行信息资源的自动化管理是实现数字资源共享的关键,也是信息技术整合的基本目标。根据目前数字信息资源整合发展的变化,我们可以发现,有一类信息技术在数字信息资源开发与利用中正发挥着越来越重要的作用,如中间件技术、SOA、EAI、数据交换技术、搜索引擎、Web2.0、SFX等信息技术,能很好地解决数字信息资源的IDL映射、数据字段统一映射以及服务器端服务对象和客户端调用等问题,从而实现对不同数字信息资源的整合,实现对数字信息资源的自动管理。

(2)标准和规则的整合

标准化和规范化是实现信息资源整合与共享的前提与保证,也是数字信息资源整合的主要内容。由于图书馆数字信息资源涉及的信息和知识囊括了所有学科,数量极其庞大,类型特别繁多,而且包括了文字、图像、表格、音频等多媒体的数字化表达和无缝链接,因此对数字信息资源的组织相当复杂,迫切需要统一的标准和规则来规范数字信息资源整合活动。这些标准和规则是进行数字信息资源整合的法律保证,也是建立数字信息资源保障体系的必要条件。尤其是随着图书馆现代化程度的提高以及数字信息资源的不断增长,如何将众多的力量协调组织起来,实现图书馆数字信息服务的互联互通、资源的共建共享,是当前急需解决的主要问题。从技术管理的角度上考虑,解决这一问题的关键就在于标准化。应当在充分调研的基础上,逐步推出相对完善的标准和规则,如数字信息资源的储备、描述与标识、检索查询、交换和使用的标准与规范等,并使之成为标准体系的重要基础。标准化建设提供了关于数字信息资源系统整合的一系列完整的标准,并规范数字信息资源的开发、生产和组织管理的行为,从而使理想化的数字信息资源整合得以实现。数字信息资源标准与规则的整合大体涉及两个方面:

第一,网络通讯标准的整合。整合网络通讯标准的目的是为了实现数字信息资源需求者与提供者之间的对话,实现数字信息资源的相互传递。目前网络信息服务中,Z39.50协议发挥着重要的作用,但它并不能解决所有的问题。因为Z39.50主要是处理网络的服务器/客户端模式的通信标准,同时它也是一个有关信息检索的标准,根据这个标准构成的检索系统可以检索多种不同类型的信息,如文本、图像和其他多媒体资源等。因此它是一种实现数据库系统之间通讯的协议之一,不仅能使异构数据库系统和异构网络之间相互传递信息,而且也可以成为一种通用的数据库接口规范,为用户提供一种统一的接口,通过互联网检索多个服务器上的多种数据库资源。然而并不是所有的数字信息资源都用这种形式。例如单机版的数字资源的利用,就需要类似开放数据库联结(ODBC)的标准;还有网络版百科全书之类的数字信息资源,也需要相应的标准和规则进行处理。

第二,信息组织标准的整合。图书馆由于长期以来各自进行数字信息资源的建设和组织数字信息服务,缺乏统一的标准和规则,信息资源的组织、开发与利用效率低下,大量的数字信息资源得不到充分的利用。因此在数字信息资源与服务整合过程中,加强技术标准和服务规范的指导,强化信息组织数据标准的建设,推进数字信息资源整合进程,就要求在数字信息资源整合中严格执行各种著录、标引规则,深化标准化建设。通过数字信息资源组织标准的整合,不仅促进图书馆不同数字信息资源系统间的集成,另一方面也有利于数字信息资源的开放性协同与建设,在多馆合作的基础上实现数字信息资源与服务的共享。数字信息资源组织标准的整合主要包括数据标记格式的标准化、资源描述语言的标准化和多媒体资源的标准化等内容。如CALIS在整合各高校图书馆数字资源的过程中先后推出了《CALIS子项目建设技术标准与规范》、《中国高等教育数字图书馆技术标准与规范》(简称《CADLIS技术标准与规范》),不仅作为构建数字信息服务保障体系的依据和指南,同时也应用于数字信息资源整合平台的建设之中。

《中国高等教育数字图书馆技术标准与规范》的内容包括了CADLIS总体架构和基本技术标准与规范、CADLIS技术与管理总体框架、CADLIS门户建设规范、CALIS子项目参建馆本地系统建设技术规范、专用数字对象描述型元数据规范、CALIS基本标准与规范、CALIS基本接口规范。CALIS定义的接口规范,包括了OAI、METS、数字对象交换、统一检索协议ODL、OpenURL、CALIS-OID、统一认证、统一计费、日志与统计等内容。同时,《CADLIS技术标准与规范》还包括各个子项目专用的技术标准与规范,是全国高校分布式联合虚拟参考咨询系统、全国高校重点学科网络资源导航库系统、全国高校专题特色数据库本地系统、全国高校学位论文全文数据库系统本地系统、全国高校教学参考信息管理与服务系统等所需遵循的标准规范。

(3)数据资源整合

数据资源整合是指“对异构资源系统中的异质、异类的数据在逻辑上或物理上有机地集中,提供统一的表示和操作,以解决多种异构数据资源的互联与共享”(2),数据资源整合是数字信息资源基础建设的重要内容,也是实现信息资源系统整合与集成的关键和基础。分布在各种数据库中的数据资源是数字信息的基本构成,也是图书馆数字信息服务的基本要素,对结构化的数据资源集中是数字信息资源整合的基本内容。具体来说,数据资源整合是将来自多个数据库中的数据组合为一个单一资料库,以减少成本,提高资源利用率,更好地满足信息用户的需求。因此,它具有降低经营成本,增强数据访问完整性的作用,同时也具有增加可靠性可用性、可扩展性的特点。数据信息资源的整合通常包括数据的准备、数据挖掘、知识评估等内容。数据的准备主要包括数据选择、数据清理和数据预处理;数据挖掘的主要任务是确定发现知识的种类,研究数据挖掘的模型和算法,发现规则知识,并根据数据资源的挖掘任务和特点,选择合适的挖掘模型和算法;知识评估则是对数据资源的实用价值进行分析评价,最终得到所需的有用的数据和知识。

在通常情况下,图书馆数据信息的整合除了异构数据库资源的数据之外,还应注意以下几种数据:

①图书馆集成管理系统数据。由于无法从数据录入系统的数据模式中直接得到许多综合度较高的数据,必须进行专门的数据抽取,计算出大量的中间数据。根据图书馆集成管理系统的数据,可以对信息用户的需求进行静态与动态的分析,抽取能客观反映内部质量属性的“度量”。

②网络传递的数据。通过选择可跨平台的架构组件、特别是服务器软件,使用HTML、XML等开放式标准,采用跨平台技术,按照普遍适用的应用程序框架进行开发,使信息资源数据整合具备控制的能力。

③非规范的数据。用户可以通过普及运算设备,方便地连接到整合数据,实现统一的方式运行硬件和操作系统平台。

(4)信息内容整合

数字信息内容整合是指通过信息资源整合机制和标准,对不同类型、不同来源、不同载体的数字资源进行集成、描述和链接,对蕴涵在数据或信息集合中的内容关联进行深入的揭示与整合,从而使相对独立的信息内容形成内在的联系,以真正实现数字信息资源的全方位整合和“一站式”获取。如果说数据整合是对结构化的数字资源进行整合的话,那么信息内容整合则是对非结构化的数字资源进行整合,其本质就是通过一定的技术手段,将数字信息资源“基本属性间的多种复杂关系进行衔接与整合,使分散的、异构的文献及其关系形成一个有机关联的整体”(3)。它是在数据整合基础上的进一步深化,是数字信息资源整合的必然结果。由于数据整合解决了异构数据库中信息资源的合并问题,实现了多种异构数据库资源的互通互连和统一检索。但信息内容之间的多重关联却没有得到很好的揭示,而这种内容之间的联系又是信息用户利用数字信息资源的依据和主要内容。因此,如何在统一的数字信息服务平台入口处,既提供“一站式”的检索界面,又提供多种内容关联的数字资源,使图书馆用户能够“一步到位”获取所需信息,则成为数字信息资源整合的主要内容。数字信息内容的整合应充分体现信息资源的组织机制,其内容具体包括数据资源的组织、信息内容揭示以及统一标识系统等。具体表现为以分类法、主题词表等信息组织体系科学地组织各种数据资源,并通过元数据对数据资源的内容、位置、关系进行揭示与描述,并以URI/DOI作为数字信息资源对象的标识基准进行有效链接,使数据信息内容的多重关系在唯一标识符的基础上实现异构系统中的定位和链接,从而使信息内容的整合最终得以实现。

(5)服务流程的整合

通过对信息资源内容的分析与重组,按照数字信息内容之间的逻辑关系构成立体网状的、相互联系的数字信息服务的资源保障系统,更快速、方便地提供给用户利用,是数字信息资源整合的主要目的。随着数字信息资源整合的深入,数字信息服务流程的整合成为人们关注的问题。在数据和内容整合的基础上,我们可以寻求数字信息服务过程的改造和完善。数字信息服务过程的整合首先能够将图书馆内部分散的信息组织规则和不同载体提供利用的业务流程优化组合,形成外显化的服务流程和规范化的搜索平台,这种数字信息服务流程的外显化转移增强了图书馆服务的灵活性,为信息用户充分利用图书馆的数字信息资源提供了多种选择通道和环境,从而加快了数字信息传递的速度,提高了图书馆数字信息服务的质量。其次,数字信息服务流程的优化组合,能够使图书馆针对用户个性化的需求进行信息推送,最大限度地满足不同层次用户的信息需求,提高图书馆个性化服务的程度。再次,数字信息服务流程的整合,可以提高图书馆服务过程的自动化水平和执行过程的整体效率,增强图书馆协同服务和合作服务的能力,为实现信息资源共享提供有效的服务保障。

(6)服务功能的整合

图书馆服务功能的整合是在图书馆数字信息服务业务流程的逻辑层面上进行优化和集成。通过对服务功能进行不同粒度的封装,提供标准化的功能组件和服务,作为不同应用系统间的标准接口,用于所有接受这个标准的应用的调用请求。服务功能的整合具有以下要求:

①进行服务功能组件化封装,提供良好的无缝式的数字信息服务接口。

②服务接口的定义要具有硬件平台、操作系统和编程语言无关性。

③注重服务功能组件和服务的统一性,并能运用通用的方式进行交互。

④注重服务功能的稳定性,当组件或服务中产生变化时,不会导致所链接的组件或服务也发生变化(4)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈