首页 百科知识 数据管理的发展

数据管理的发展

时间:2022-10-03 百科知识 版权反馈
【摘要】:数据冗余造成每个应用程序都有对应的文件, 有可能同样的数据在多个文件中重复存储。具有高度的物理独立性和逻辑独立性, 应用程序与外存中的数据之间由数据库管理系统实现。数据库系统提供了数据的四种控制功能, 包括并发控制、 数据库恢复、 数据完整性和数据安全控制。数据管理增加了系统的灵活性。该阶段对多应用程序数据共享, 减少数据冗余, 为数据与应用程序独立提供了条件。

数据管理的发展历史可以分为以下四个阶段。

一、 第一个阶段——人工管理

人工管理阶段 (20世纪50年代中期以前) 的特点如下:

1. 数据不能共享

不同的程序均有各自的数据, 这些数据对不同的程序通常是不相同的, 不可共享; 即使不同的程序使用了相同的一组数据, 这些数据也不能共享, 程序中仍然不能省略这组数据。基于这种数据的不可共享性, 必然导致程序与程序之间存在大量的冗余数据, 浪费了存储空间。

2. 数据与程序不具有独立

基于数据与程序是一个整体, 数据只为本程序所使用, 即一组数据对应一组程序, 如图2.1所示。

图2.1 第一阶段数据管理

二、 第二个阶段——文件管理

在这一阶段 (20世纪50年代后期至60年代中期) 计算机不仅用于科学计算, 还用于信息管理方面。 操作系统中的文件系统是专门管理外存的数据管理软件, 文件是操作系统管理的重要资源之一。 数据处理方式有批处理, 也有联机实时处理。 此阶段特点如下:

1. 存储方式

数据以 “文件” 形式可长期保存在外部存储器的磁盘上。 可以对文件进行大量的查询、修改和插入等操作。

2. 独立性

程序与数据之间具有 “设备独立性”, 即程序只需用文件名就可与数据进行连接, 不必关心数据的物理位置。 由操作系统的文件系统提供存取方法 (读/写)。

3. 文件类型

文件组织中有索引文件、 链接文件和直接存取文件等。 但文件之间相互独立、 缺乏联系。 数据之间的联系要通过程序去构造。 数据不再属于某个特定的程序, 可以重复使用, 由于文件结构的设计仍然是基于特定的用途, 程序基于特定的物理结构和存取方法, 因此程序与数据结构之间的依赖关系并未根本改变。 由于同一个数据项可能重复出现在多个文件中,没有形成数据共享, 又不易统一修改, 容易造成数据的不一致。 这样造成文件之间缺乏联系, 存在大量冗余。

4. 文件与程序的对应关系

对数据的操作以记录为单位。 由于文件中只存储数据, 不存储文件记录的结构描述信息, 文件的建立、 存取、 查询、 插入、 删除、 修改等所有操作都需要用程序来实现。 数据冗余造成每个应用程序都有对应的文件, 有可能同样的数据在多个文件中重复存储。 第二阶段数据管理如图2.2所示。

图2.2 第二阶段数据管理

三、 第三个阶段——数据库管理

该阶段 (20世纪60年代后期), 数据管理技术进入数据库系统阶段。 数据库系统克服了文件系统的缺陷, 提供了对数据更高级及更有效的管理。 数据库系统阶段的数据管理具有以下特点:

1. 数据库共享

数据库系统采用数据模型表示复杂的数据结构。 数据模型不仅描述数据本身的特征, 还要描述数据之间的联系, 这种联系通过存取路径实现。 此时数据面向整个应用系统。 数据冗余明显减少, 实现了数据共享。

2. 数据独立性

数据库系统有较高的数据独立性。 数据库的结构分成用户的局部逻辑结构、 数据库的整体逻辑结构和物理结构三级。 具有高度的物理独立性和逻辑独立性, 应用程序与外存中的数据之间由数据库管理系统实现。

3. 提供了方便数据接口

数据库系统为用户提供了方便的用户接口。 用户可以使用查询语言或终端命令操作数据库, 也可以用多种程序语言访问操作数据库。

4. 提供了安全性

数据库系统提供了数据的四种控制功能, 包括并发控制、 数据库恢复、 数据完整性和数据安全控制。 其中, 并发控制能避免并发程序之间互相干扰, 防止数据库被破坏, 避免提供给用户不正确的数据; 数据库的恢复, 在数据库被破坏或数据不可靠时, 系统有能力把数据库恢复到最近某时刻的正确状态; 数据库的完整性能保护数据库始终包含正确的数据; 数据安全控制保证数据的安全, 防止数据丢失或被窃取、 破坏。

5. 减少了数据冗余

数据管理增加了系统的灵活性。 对数据的操作不一定以记录为单位, 可以以数据项为单位。 该阶段对多应用程序数据共享, 减少数据冗余, 为数据与应用程序独立提供了条件。 第三阶段数据库管理结构如图2.3所示。

图2.3 第三阶段数据库管理

四、 第四个阶段——分布式数据库系统与面向对象数据库系统

该阶段 (20世纪70年代后期至今) 广泛使用分布式数据库系统, 它的显著特征是与网络技术紧密结合, 用户使用Internet即可访问多个数据库。 其主要特点如下:

1. 分布式存储

合理分布数据在系统的相关结点上, 实现结点共享, 逻辑上属于同一系统, 但在物理结构上是分布式的, 因此用户不需关心数据的分布, 由若干个结点集合而成, 在通信网络中连接在一起, 每个结点都是一个独立的数据库系统, 都拥有各自的数据库、 中央处理机、 终端以及各自的局部数据库管理系统。

2. 减少开发成本

客户机通过浏览器即可访问远程数据库, 不需录入和安装专门的数据库软件, 这样大大降低了应用程序发布和维护的开销。

3. 便于远程操作

能方便使用网页技术, 开发远程登录的数据库管理信息系统, 且支持跨平台操作。 其结构如图2.4所示。

图2.4 第四阶段数据库管理

面向对象数据库系统: 是数据库技术与面向对象程序设计技术的结合。

优点: 它克服了传统数据库的局限性, 能够自然地存储复杂的数据对象及它们之间的复杂关系, 大幅提高了数据库管理效率, 降低了用户使用的复杂性。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈