首页 百科知识 文件系统方法

文件系统方法

时间:2022-06-20 百科知识 版权反馈
【摘要】:2.1.1 文件系统方法既然数据是信息系统的一个重要组成部分,数据的管理如此重要,那么在信息系统中应当如何管理数据呢?所谓的文件系统,是指计算机操作系统中负责管理和存储文件信息的软件。因此,文件系统无法及时地响应管理者的信息查询需求。为此而进行的程序维护工作是文件处理系统的最大负担。由于文件系统缺乏对数据的控制和管理机制,对于数据的访问和传播可能失去控制。

2.1.1 文件系统方法

既然数据是信息系统的一个重要组成部分,数据的管理如此重要,那么在信息系统中应当如何管理数据呢?

文件系统是在计算机上存储数据的最简单方法之一。所谓的文件系统,是指计算机操作系统中负责管理和存储文件信息的软件。文件系统把各软件应用程序使用的数据组合在一起作为文件,数据以“文件”形式可独立于应用程序长期保存在外部存储器上。文件系统成了应用程序和数据之间的接口,即应用程序通过文件系统对文件进行查询、修改和插入等操作。

通常,组织的各个职能部门都会建立各自的信息系统,并且各系统都有相应的数据文件以存储所需的数据。下面,我们以一所大学为例来说明文件系统的方法是如何管理数据的以及采用这种方法来管理数据会造成哪些问题。

一所大学的学生处(管理学生的注册、学籍等)可能会开发处理学生注册的软件,它有自己的文件系统。这所大学的财务处(管理学生学费交纳等)还可能开发管理学生财务账户的应用程序,它同样有自己的文件系统。

假设学生处和财务处的信息系统都建立了存储学生基本信息的文件。由于这两个系统是分别建立的,所以它们只能从自己的文件中获取数据,而不能很容易地共享其他应用程序的数据。因此,学生处的信息系统可能不知道学生是否缴纳了本学期的学费。

某大一新生熊小炎住在武汉市珞瑜路55号,邮编为430072。在他刚进大学时,他把这个信息提供给了他所在大学的学生处和财务处,这样每个办公室的系统都需要将它的信息输入一次,这个过程即插入数据。由于是人工输入数据,所以在输入数据时难免会出现错误,额外的数据输入将产生更多的数据输入错误,这称为数据插入异常。

新学期开始后,学校开始评奖学金,准备给成绩优异而家庭比较困难的同学以经济上的帮助,这时,学生处的工作人员需要查询熊小炎的个人信息,从数据文件中获取其家庭收入状况的信息,这一过程称为查询。

在第一学期结束后,熊小炎一家搬到了东湖开发区的阳光别院。他将这一信息告知学生处的工作人员,因此在学生处的信息系统中修改了他的地址,但却忘记去财务处进行修改。现在这两个系统中就有熊小炎的两个不同的地址。更糟糕的是,由于这两个系统不相互对话,所以,学校没有办法辨别哪个地址是正确的。这种不能共享数据的现象称为更改异常。

四年后,熊小炎从大学毕业了,他在学生处办理了相应的手续,以便他可以参加毕业典礼和拿到毕业证。但是,他又忘记通知财务处。这样,在每学期开始时,财务处都认为熊小炎还是该学校的学生,因而给他寄去了学费账单。这种没有删除冗余数据的问题则称为删除异常。

用文件系统方法管理数据的缺陷

通过上文的例子,可以看出,采用文件系统方法来管理数据,将会带来了一系列的问题,如不能共享数据,安全性不够以及会产生插入、更新和删除异常等,总结如下:

数据冗余和数据不一致。所谓的冗余,是指多个文件中重复存储了相同的数据,显然这种重复是不必要的。上文例子中学生的基本信息出现在多个应用程序中就是冗余。之所以出现冗余,是由于各个部门各自建立独立的信息系统,而每个信息系统都需要文件来存储各自需要的信息,这些信息必然有些是相同的,这就导致了数据冗余的出现。

数据冗余不但浪费存储空间,还导致了数据之间的不一致性。数据的不一致性是指相同的实体属性(实体、属性的概念详见下文)出现不同的值。若数据冗余存在,在进行数据更新时必须确保每个文件都得到同样的更改,但实际上做到这一点非常困难,所以经常发现存放在不同文件里的数据存在不一致性。例如,上文中学生地址更新的情形。导致数据不一致的另外一个可能的原因是同样的数据在不同的系统中存在不同的表达方式,如有的系统中用“F”表示女性,“M”表示男性,有的系统用“0”表示女性,“1”表示男性,这就导致了不同系统之间数据表达的不一致。

缺乏数据集成、不够灵活。通常,用户的信息需求(如各种管理报表)需要访问几个文件里的数据才能得到满足。但是,如果将数据分散存储于若干独立文件里,必须要写特定的程序才能从每个独立文件里检索到相应的数据,编写这样的程序不仅困难、增加系统的成本,而且耗费时间太长。因此,文件系统无法及时地响应管理者的信息查询需求。

数据的独立性差,数据与程序相互依赖。在文件处理系统中,应用程序与相应的数据文件之间存在着很强的依赖关系。因此,一旦某个应用程序改变了,相应的数据也要随之改变,原因是各种不同的传统计算机程序对数据有各自不同的要求。反之,文件里的数据格式或结构的改变也会牵扯到所有调用它们的应用程序,这些应用程序也都必须随之改变。为此而进行的程序维护工作是文件处理系统的最大负担。事实证明很难做到正确无误,因而会导致数据文件里存在大量的数据不一致性。

共享性低。由于所需要的信息通常分布在不同的文件、不同的部门内,相互之间缺乏联系,因此,实际上实时的数据共享是不可能实现的。而且由于很有可能存在数据的不一致性,而使系统的可靠性大大降低。

安全性差。由于文件系统缺乏对数据的控制和管理机制,对于数据的访问和传播可能失去控制。我们可能无法得知谁在读取甚至修改重要的数据。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈