首页 百科知识 数据仓库的体系结构与实现

数据仓库的体系结构与实现

时间:2022-10-17 百科知识 版权反馈
【摘要】:图10-16显示了数据仓库系统的基本体系结构图。向上是数据仓库层和数据仓库工具层。人们在早期开发数据仓库时,一般是先建立一个全局的数据仓库结构,然后再在其基础上建立各种应用,称为“自顶向下”的方法。随着数据仓库技术的发展,如今数据仓库的实现策略已由原来的“自顶向下”模式,发展为“自顶向下”、“自底向上”、“平行开发”3种模式。数据集市中的数据是为某部门DSS应用而从数据仓库中抽取的。

10.4.3 数据仓库的体系结构与实现

一、数据仓库的体系结构

在数据仓库中数据和信息从不同的数据源提取出来,然后把这些数据转换成公共的数据模型并且和仓库中已有的数据集成在一起。当用户向仓库进行查询时,需要的信息已经准备好了,数据冲突、表达不一致等问题已经得到了解决。这使得决策查询更容易、更有效。

作为一个系统,数据仓库至少应包括三个基本的功能部分:

(1)数据获取:这部分负责从外部数据源获取数据。数据被区分出来,经过提取、清洁、转换、聚集等步骤得到集成和综合的数据,载入数据仓库。

(2)数据存储和管理:这部分负责数据仓库的内部维护和管理,提供的服务包括数据存储的组织、数据的维护、数据的分发、数据仓库的例行维护等。

(3)信息访问:信息访问部分属于数据仓库的前端,面向不同种类的最终用户,这里主要由桌面系统的各种工具组成。数据仓库的最终用户在这里提取信息、分析数据集、实施决策,从而可望取得竞争优势。进行数据访问的软件工具,主要是可视化工具、多维分析工具和数据挖掘工具等。新的发展趋势是把信息访问工具紧密集成到数据仓库系统中。

图10-16显示了数据仓库系统的基本体系结构图。三个功能分别对应了三个不同层次,底层是数据源。它不但指那些常见的数据库,也包括文件、HTML文件、知识库、遗留系统等各种数据源。向上是数据仓库层和数据仓库工具层。最上层是最终用户。虽然图中表示的是单一、集中的仓库,但仓库能够以分布式数据库系统来实现。实际上,为了获得期望的性能,常常需要数据的并行和分布处理。

img202

图10-16

二、数据仓库实现策略

人们在早期开发数据仓库时,一般是先建立一个全局的数据仓库结构,然后再在其基础上建立各种应用,称为“自顶向下”的方法。但这种方法存在许多问题,如规模大、投资大、周期长、部门间资源竞争和需求矛盾等。为解决这些问题,提出了数据集市的概念。数据集市是支持某一部分或特定商业需求的DSS应用的数据集合。数据集市中的数据仍具有数据仓库中数据的特点,数据组织结构也与数据仓库类似,只不过数据集市中的数据是专为某一部门或某个特定商业需求定制的。

随着数据仓库技术的发展,如今数据仓库的实现策略已由原来的“自顶向下”模式,发展为“自顶向下”、“自底向上”、“平行开发”3种模式。

(1)“自顶向下”模式:对分散在企业各处的数据库中的数据集市建立全局性的数据仓库。数据集市中的数据是为某部门DSS应用而从数据仓库中抽取的。数据集市中的数据是数据仓库数据的一个子集。数据从数据仓库流向数据集市。这种方法的特点是可以统一规划,效率高,但是投资大,周期长。

(2)“自底向上”模式:从建立各部门或特定商业问题的数据集市开始,全局性数据仓库建立在数据集市的基础上,即数据从数据集市流向数据仓库。特点是投资少、见效快。

(3)“平行开发”模式:在一个全局性数据仓库的数据模型的指导下,数据集市和全局性数据仓库的建立同时进行。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈