首页 百科知识 数据仓库与决策支持

数据仓库与决策支持

时间:2022-10-09 百科知识 版权反馈
【摘要】:数据仓库的最终的目标是尽可能让更多的公司管理者方便、有效和准确地使用数据仓库这一集成的决策支持环境。图中包括数据仓库层、工具层及它们之间的相互关系。由于这些特点,数据库的大小对系统性能影响不大。②数据仓库的并行处理能力。另外,同关系数据库具有结构化查询功能一样,多维数据库也需要一种能表达多维查询的语言。可以预见的是,随着多维数据库研究与应用的不断发展,MDSQL将会越来越趋向于成为一种通用的标准化语言。

5.3.1 数据仓库与决策支持

当信息化的浪潮席卷全球的时候,世界各地的公司都花大力气建立自己的数据仓库和数据库,利用现代的信息技术来管理公司,以求在竞争日趋激烈的全球经济中保持竞争力,越来越多的关键性数据存入了数据仓库和数据库。目前,数据仓库和数据库的数据量正在变得越来越惊人。尽管超大容量的存储设备替我们保存了许多宝贵的数据,但数据库技术的发展是否能满足数据量增长的要求呢?存放在数据库中的数据的利用率是否就很高了呢?回答是否定的,大量的数据被锁入计算机系统的迷宫中,数据库变成了数据监狱。由于数据仓库中惊人的数据量,数据仓库像数据库一样变成数据监狱的可能性大大增加。对于一个企业来说,仅拥有数据仓库,而没有高效的数据分析工具来利用其中的数据,就如同守着一座储量丰富的金矿,却不知道如何去采掘。

在当前这一场信息革命之中,在激烈的竞争面前,迫切需要出现一种新的模式来处理这些浩若烟海的数据。这需要有强大的工具来收集和整理数据,更需要强大的数据分析工具来使用这些数据,使之转变成为对企业的决策有价值的信息资源。数据仓库的最终的目标是尽可能让更多的公司管理者方便、有效和准确地使用数据仓库这一集成的决策支持环境。为实现这一目标,为用户服务的前端工具必须能被有效地集成到新的数据分析环境中去。因为在数据仓库的整个结构中,前端工具是最直观、最能让用户感受到数据仓库环境的部分。如果所选择的前端工具不能给最终用户提供灵活自主的信息访问权利、丰富的数据分析与报表功能,那么数据仓库中的数据就不能得到充分利用。

(1)数据仓库系统的结构。

数据仓库系统(Data Warehouse System)以数据仓库为基础,通过查询工具和分析工具,完成对信息的提取,满足用户的各种需求。由此可得数据仓库体系,结构如图5.1所示。

图中包括数据仓库层、工具层及它们之间的相互关系。数据仓库是大量集成化数据的集合,它的主体由关系数据库构成,但是某些层次的数据也可能由其他类型的数据(如多维数据)组成。各类分析工具与数据仓库的不同数据层连接,不同的用户可以从不同的数据层次,利用不同的分析工具来提取不同类型的信息。

img73

图5.1 数据仓库体系结构

数据仓库系统是多种技术的综合体,它由数据仓库(DW)、数据仓库管理系统(DWMS)、数据仓库工具三个部分组成。在整个系统中,数据仓库居于核心地位,是数据挖掘的基础;数据仓库管理系统负责管理整个系统的运转;数据仓库工具则是整个系统发挥作用的关键,只有通过高效的工具,数据仓库才能发挥数据宝库的作用。

(2)数据仓库查询。

数据仓库和数据库不同,它保存的是大量主题数据和历史数据,一般不作修改,因此,用户对数据仓库的工作主要是查询和分析。数据仓库的查询和数据库查询有很大区别。对数据库的查询很简单,每次返回的数据量也很小。查询时,一般知道自己要找什么。由于这些特点,数据库的大小对系统性能影响不大。

对数据仓库的查询大多非常复杂,主要有两种:一种以报表为主,从数据仓库中产生各种形式的业务报表。这种查询是预先规划好的查询(pre-defined query);另一种则是随机的、动态的查询(ad-hoc query),对查询的结果是不能预料的。

由于数据仓库的查询有其复杂性,所以会经常使用多表的连接、累计、分类和排序等操作。这些操作都要对整个表进行搜索,每次查询返回的数据量一般都很大。对于Ad-Hoc查询而言,经常需要根据上次查询的结果进行进一步的搜索。

在数据仓库查询中还要预先考虑几个问题。①数据仓库的可扩展能力。当数据仓库投入使用后,各业务部门的要求会越来越多,使得数据仓库中数据量的增长速度加快。因此,设计数据仓库时,对可扩展能力必须考虑。②数据仓库的并行处理能力。数据仓库的并行处理能力是另一个必须考虑的问题。鉴于数据仓库查询的复杂性,每个查询必须占用很多的系统资源,如果并行处理能力不强,当多个用户同时发出查询请求时,响应时间可能长得不可容忍。为了更准确地分析市场发展规律,提高企业的竞争优势,数据仓库中要存储尽可能详细的数据,为决策提供更加可靠的信息。因为数据仓库的详细数据包含了许多有价值的信息,经过综合处理后,可能会丢失这些信息。

另外,同关系数据库具有结构化查询功能一样,多维数据库也需要一种能表达多维查询的语言。这就是多维查询语言——MDSQL。类似于关系型SQL语言,这种多维查询语言同英语很相似。可以预见的是,随着多维数据库研究与应用的不断发展,MDSQL将会越来越趋向于成为一种通用的标准化语言。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈