首页 理论教育 数字信息资源与服务整合的机制

数字信息资源与服务整合的机制

时间:2022-03-10 理论教育 版权反馈
【摘要】:由于数据仓库集中管理了来源不同的多个数据库系统,简化了用户访问信息的复杂度,提高了数字资源的访问速度,整合了异构数据库系统的性能,所以数据仓库能够将各种数字信息内容进行集成并组织,提供整体的报表和图表。

8.3 数字信息资源与服务整合的机制

数字信息资源与服务整合的机制是指数字信息资源整合系统内各子系统、各要素之间相互制约、相互作用、相互联系的形式及运行原理,它是数字信息资源整合的关键,也是数字信息资源整合研究的重点。不同的数字信息资源整合机制导致了数字信息资源与服务整合系统在结构、模块组成和所采用技术等方面的差异,也直接影响了数字信息资源与服务整合系统的运行效率。因此,数字信息资源的整合机制是数字资源整合的核心问题。目前,对于数字信息资源整合机制的研究成果并不多见,李广健等人从技术的角度出发提出了数字信息资源整合的机制,认为数字信息资源整合的实现机制大体可以归纳为四种,即数据仓库整合机制、中介器封装器整合机制、代理整合机制、P2P整合机制(5)。数字信息资源与服务的整合是一个有机的整体,在这个整体中,除了运用数字信息资源整合技术之外,还需要运用系统原理构建数字信息资源利用的服务体系。根据数字信息资源整合平台的构建结构,我们认为,数字信息资源与服务整合的机制主要体现为数据仓库整合机制、中间件整合机制、工作流整合机制等。

8.3.1 数据仓库整合机制

数据仓库是一种物理整合方式,是从多个内容相关、物理和逻辑上都相互独立的数据源中提取的面向主题数据集合的数字信息资源整合机制。它“将不同来源的数字资源按特定的方式(通常是按主题或其他多维方式)建模并存储在同一物理位置(称为数据仓库),提供给用户一个新的、统一的目标数据模式,使得用户能够一站式地访问各种数字资源,从而达到整合的目的”(6)。因此,数据仓库整合数字信息资源具有数据组织的主题性、数据存储的集成性、数据格式的一致性、数据传递的相对稳定性、数据内容的系统性等特点。数据仓库具有三方面的主要作用:首先,提供标准的报表和图表功能。由于数据仓库集中管理了来源不同的多个数据库系统,简化了用户访问信息的复杂度,提高了数字资源的访问速度,整合了异构数据库系统的性能,所以数据仓库能够将各种数字信息内容进行集成并组织,提供整体的报表和图表。其次,数据仓库支持数据的多维分析。多维分析是通过把一个实体的多项重要的属性定义为多个维度,使得用户能方便地汇总数据集,简化了数据的分析处理逻辑,并能对不同维度值的数据进行比较,而维度则表示了对信息的不同理解角度。应用多维分析可以在一个查询中对不同阶段的数据进行纵向或横向比较,有利于实施比信息检索更复杂、更深入的数据挖掘、知识发现等服务。最后,数据仓库是数据挖掘技术的关键基础,数据挖掘技术要在已有数据中识别数据的模式,以帮助用户理解现有的信息,并在已有信息的基础上对未来的状况作出预测(7)

运用数据仓库机制整合数字信息资源可以形成一个较完整的结构体系,包括异构数据源层、元数据抽取与创建层、数据仓库构建层、数据仓库管理层和应用层。其中,异构数据层实现结构化业务数据、非结构化业务数据和元数据的获取、建库与更新;元数据抽取与创建层的主要功能是对数据进行预处理,通常包括数据抽取、数据转换、数据净化等过程;数据仓库构建层主要是对来自异构数据源的数据转换、净化,并向元数据库进行转移和加载,创建数据仓库;数据仓库管理层主要提供对数据仓库的管理和支持,包括数据仓库的数据管理和数据仓库的元数据管理两部分;数据仓库应用层的主要功能是展示数据仓库检索界面,提供查询工具,从而实现数据仓库的应用服务。实现数据仓库整合数字信息资源的技术主要有数字信息资源的存储与管理技术、数据信息的抽取技术、信息挖掘与分析技术、数字信息的监控与更新技术等。但必须注意的是,运用数据仓库进行数字信息源整合的前提是合法获取来源系统的数字信息资源。

数据仓库整合机制的结构体系如图8-1所示。

img30

图8-1 数据仓库整合机制的结构

随着数据仓库整合机制应用范围的扩展,数字信息资源整合表现出以下发展趋势:①数据资源的获取范围向广度延伸,即数据仓库集成对象从传统的异构数据库向Web数据集成发展;②服务内容向深度发展,即利用数据挖掘技术和联机分析处理技术,实现更高层面的决策服务;③随着一些互操作协议的发布与应用,数据仓库对数据源的整合方式,从对异构数据源被动“抽取”数据向主动“收获”数据的方式转变。

8.3.2 中间件整合机制

所谓中间件是指一种位于客户机服务器的操作系统之上,管理数字资源和网络通信的独立的系统软件或服务程序。它能够使分布式应用软件系统在不同的技术环境之间共享资源。因此,在整合系统中,中间件通常被运用于系统的应用层。中间件整合机制是一种对数字资源进行虚拟整合的运行机制,它并不将各数据源的数据集中存放,而是通过Wrapper/Mediator结构的中间件满足上层集成应用系统的需求。因此,这种方法的核心就是中间件(Mediator)。它是将分布式的异构数据库的数据资源通过中间件进行逻辑结构的整合,而被整合的数据仍存储在异构数据源之中。其运行的机理表现为:中间件接收用户查询并将之转换成中间格式,然后提交给相应的封装器,而封装器(Wrapper)则对异构数据资源进行链接、查询和封装,并将用户的查询转换为基于异构数据源的公共数据模型(Common Data Model,CDM),其查询执行引擎(Query Execute Engine)再通过各数据源的封装器将结果抽取出来,实现对多个分布式资源的检索,并对从Wrapper或其他Mediator中获取的查询结果信息进行整合处理,最后由中间件将结果集成并返回给用户。可见,中间件整合机制实现的是对分布式的异构数据资源的整合,即数字信息资源整合系统并不存储数字信息资源,而是通过中间件对数字信息资源进行封装处理之后,提供给用户利用,所以它具有有效支持数字信息资源的分布式组织,保持各个异构数据源的自治性;提高数字信息资源整合平台组件的实用性;降低数字信息资源整合系统开发的成本等功能。中间件整合机制最大特点是保持数字信息资源分布式组织模式的相对稳定,通过在数字资源与用户之间构造一个中间件,实现对分布式资源的封装,从而为用户提供一个统一的检索界面。同时,中间件整合机制解决了数字信息资源整合中的数据更新问题,弥补了数据仓库方法整合机制中数据更新的不足。目前,中间件整合机制发展很快,人们运用本体技术与语义相关的整合技术构建分布式数字信息资源整合平台,以期望“能够有效地根据用户信息需求解决知识整合、个性化服务等问题,因而该整合机制是目前实现数字资源整合的主流方式”。(8)

中间件整合机制的结构体系如图8-2所示。

img31

图8-2 中间件整合机制的结构

可以看出,运用中间件整合数字信息资源的实质是通过对分布的数字信息资源进行虚拟的逻辑的整合,为信息用户构建了一个广泛利用数字信息资源的跨库检索系统,从而形成数字信息资源利用的环境。它为信息用户提供了一个对分布式数字信息资源利用的统一检索平台,使信息用户可以检索和查找多个网络数据库的信息资源,在对各数据库检索结果进行汇总和去重的基础上,实现数字信息资源统一的利用通道。

实现中间件整合机制的信息技术主要有:

①信息源选择技术,通过对数字信息源描述和信息源的选择确定相关度高的数字信息资源。

②信息抽取技术,将参与整合的半结构化、非结构化信息源中的数字资源转化成结构性强的数据资源,以提高数字信息资源查询的速度和效率。

③信息查询转换技术,对用户查询进行语法的分析、检验和优化,并将其转换成中间格式,进行不同信息源的多个查询。

④查询结果整合技术,在信息查询的基础上,整合系统对来自不同信息源的查询结果进行整合,以统一的形式提供用户查阅和利用。

8.3.3 工作流管理机制

所谓工作流(Workflow)是指业务流程的计算机化或自动化形式,是通过计算机模型形成的一系列相互衔接、自动进行的业务活动或任务环境。工作流管理系统是一种能定义、创建和管理工作流执行的系统,其核心部件就是工作流管理控制器(工作流引擎)。工作流管理机制是指选择成熟的工作流管理系统(工作流引擎和流程控制器),把需要进行业务流程集成的应用系统中的活动进行封装,改造成活动服务提供流程控制器管理,并通过流程控制器的编排,实现灵活的服务业务流程定制和集成的机制。工作流管理机制的主要作用是实现整合系统的工作流集成,减小业务流程自动化逻辑与应用的关联性。

工作流管理机制的功能是:

①工作流定义功能。主要是对业务处理过程的计算机定义,提供了一种或多种分析、建模、系统定义技术,将现实世界的业务处理过程转换成计算机可处理的定义。

②运行控制功能。对过程的定义进行解释,创建并控制过程的运行、调度过程的各种行为步骤,调用适当的人工和应用程序资源。工作流管理系统的核心部件就是工作流管理控制软件(工作流引擎)。

③运行交互接口。提供与人员或应用程序工具进行交互接口来处理各种活动步骤,并进行活动间的控制传递。如确定过程的状态,调用应用程序工具,传递应用程序数据等。

工作流管理整合机制的结构如图8-3所示。

img32

图8-3 工作流管理机制的结构

运用工作流管理机制整合的对象繁多,既可以对在实际工作过程中重复出现、有着固定步骤的结构化流程进行整合,也可以针对非结构化的业务工作流程建模,进行动态性整合;同时,工作流管理机制还可以将电子文档、图像等数据进行控制和优化组织,形成有效的文档管理与图像管理系统,并将系统的工作流程描述成一系列执行环节,对数据对象进行控制、封装和优化。工作流管理机制在数字信息资源与服务的整合中往往也被称为业务流程整合机制,一方面体现为对数字信息资源组织流程的整合,形成面向资源的数字信息整合流程;另一方面体现为数字信息服务的业务流程的优化和整合,形成面向用户信息需求的服务构架。它可以通过灵活的系统集成架构改善数字信息资源服务的灵活性,提供高质量的业务流程、缩短业务周期并降低数字信息服务的处理成本。同时,它还能够满足具有稳定工作流程的业务在线组装,并形成多个分布式服务间的流程控制和数据传递。

工作流管理机制为不同对象和环境条件下的数字信息资源组织与服务提供了良好组织机制和协作工作流程的途径和方法。随着数字信息资源与服务系统的不断增多,信息用户对跨区域、跨部门之间信息交互操作的需要越来越明显,而且跨区域、跨部门之间业务流程协同配合也越来越广泛,运用工作流管理机制的范围也不断扩大,工作流技术已被越来越多的人认可,与之相关的标准规范、工作流引擎及商业产品不胜枚举。人们在开发推广工作流管理软件的同时,更加注重工作流管理机制的理论研究,以推动该项技术走向成熟。目前“面向应用的数据层整合”和“面向服务的接口层整合”已成为当前数字信息资源整合的主要模式,通过中央主流程控制多个子流程的协同运行,实现数字信息资源与服务的无缝连接,形成有效利用的优化环境是数字信息与服务整合的重点。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈