首页 百科知识 数据的基本性质

数据的基本性质

时间:2022-10-18 百科知识 版权反馈
【摘要】:所谓非结构化数据即表示符号串是不规则结构形式;所谓半结构化数据即表示符号串呈半规则结构形式,如文件中的流式文件,如互联网中的Web结构等均属非结构化及半结构化形式。而在软件中的数据大多是有结构的,它们称结构化数据。首先,结构化数据有型与值之分,数据的型给出了数据表示的类型如整型、实型、字符型等,而数据的值给出了符合给定型的数值。目前数据以海量数据为多见,因此一般数据均需管理、保护与控制。

1.2.1 数据的基本性质

前面已经讲到,数据是计算机中的基本概念,它是计算机中处理、加工的对象与目标,其具体表示为存储于计算机内的二进符号串。数据一般有下面几个性质:

●数据的抽象性

从形式看,数据是一种抽象的符号串,一般来讲它不含有语义,如数据:“15”可以是“15岁”、“15元钱”,也可以是“15公斤”、“15本”等等。因此在必要时须对它作出语义解释,此时它才有真实的意义。

●数据的可构造性

从结构看,数据分为结构化数据(structured data)、半结构化数据(semi-structred data)与非结构化数据(non-structured data)。所谓非结构化数据即表示符号串是不规则结构形式;所谓半结构化数据即表示符号串呈半规则结构形式,如文件中的流式文件,如互联网中的Web结构等均属非结构化及半结构化形式。而在软件中的数据大多是有结构的,它们称结构化数据。首先,结构化数据有型(type)与值(value)之分,数据的型给出了数据表示的类型如整型、实型、字符型等,而数据的值给出了符合给定型的数值。随着应用需求的扩大,数据的型有了进一步的扩大,它包括了将多种相关数据以一定结构方式组合构成特定的数据框架,称为数据结构(data structure),具有统一结构形式和特性的具体描述可称为数据模式(data schema)。

●数据的持久性

从存储时间看,数据一般分为两部分,其中一部分与程序仅有短时间的交互关系,随着程序的结束而消亡,它们称为临时性数据或挥发性(transient)数据。这类数据一般存放于计算机内存中;而另一部分数据则对系统起着持久的作用,它们称为持久性(persistent)数据,这类数据一般存放于计算机中的次级存储器内(如磁盘)。

●数据的共享性

从其使用对象看,数据可分为私有性与共享性两种。为特定应用(程序)服务的数据称私有(private)数据,而为多个应用(程序)服务的数据则称为共享(share)数据。

●数据的海量性

从其存储数量看,数据可分为小量、大量及海量三种。数据的量是衡量与区别数据的重要标志,这主要是由于数据“量”的变化可能会引起数据“质”的变化。数据量由小变大后,数据就需要进行管理,需要保护与控制。目前数据以海量数据为多见,因此一般数据均需管理、保护与控制。

随着技术的进步与应用的扩大,数据的特性都在发生变化,这些变化主要表现为:

●数据的量由小量到大量进而到海量;

●数据的组织由非结构化到结构化;

●数据的服务范围由私有到共享;

●数据的存储周期由挥发到持久。

数据的这些变化使得现代数据具有海量的、结构化的、持久的和共享的特点,本书如不作特别说明,所提数据即具此四种特性。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈