首页 百科知识 数据与信息的定义

数据与信息的定义

时间:2022-07-05 百科知识 版权反馈
【摘要】:维基百科把大数据定义为一个大而复杂的、难以用现有数据库管理工具处理的数据集。当然,这样的定义我们暂且不评价它是否全面,但是至少从一个侧面说明了大数据将对科学研究、经济建设、社会发展和文化生活等各个领域产生革命性的影响。因此,本书给出如下定义:定义1.2 数据是指对信息的数字化解构。因此,对于大数据、数据、信息的定义和理解成为本书写作的一个大前提。

维基百科把大数据定义为一个大而复杂的、难以用现有数据库管理工具处理的数据集。

广义上,大数据有三层内涵:

一是数据量巨大、来源多样和类型多样的数据集;

二是新型的数据处理和分析技术;

三是运用数据分析形成价值。

当然,这样的定义我们暂且不评价它是否全面,但是至少从一个侧面说明了大数据将对科学研究、经济建设、社会发展和文化生活等各个领域产生革命性的影响。

在研究大数据之前,我们首先要明确什么是数据,什么是信息,以及两者之间的关系。这是研究大数据的一个重要的认知前提。

首先,我们认识一下什么是信息。

作为知识层次中的中间层,有一点可以确认,那就是信息必然来源于数据并高于数据。我们知道像2.6秒、50米、300吨,或者大楼、桥梁这些名词是没有联系的,孤立的。只有当这些数据用来描述一个客观事物和客观事物的关系,形成有逻辑关系的数据结构时,它们才能被称为信息。

显然,信息除了自然属性或者社会属性,还包括价值判断,特别是社会价值判断。只有具备了属性或价值判断,这些描述性名词才可以被称为信息,否则就会成为数据或者没有意义的符号。

因此,本书给出以下定义:

定义1.1 信息是指对事物的价值判断与属性描述。

举个例子:1.75米,如果作为一个正方形的边长,在计算正方形面积时,它就是个数据。同样是1.75米,如果用来描述一个约会对象的身高,那么传递出来的就是信息。

现在,我们来认识一下什么是数据。

我们经常说把“冰水混合物的温度规定为0℃”。通过水、温度、0℃这些词,在我们的思维结构中就形成了对客观世界的印象。而这些约定俗成的字符就构成了研究的数据基础。

当我们在刻画客观世界的时候,在给出的信息中,为了精准地描述事物的自然属性或者社会属性,或者为了精准地对事物的使用价值或者其他社会价值做出判断,就需要借助数学手段,特别是数字方式进行描述。因此,这样就产生了信息的重要组成部分——数据。

因此,本书给出如下定义:

定义1.2 数据是指对信息的数字化解构。

笼统地说,数据是使用约定俗成的字符,对客观事物的数量、属性、位置及其相互关系进行抽象表示,以适合在这个领域中用人工或自然的方式进行保存、传递和处理。

而约定形成的标准在不同的时间和空间中会有变化,这意味着在不同的种族、不同的宗教、不同的文化及国家之间,对于描述客观世界的标准和符号会产生差异。这是产生信息不对称的根本原因,所以不同环境下的主体在描述同一客体时,会出现不同的数据。例如,中国古代是按照月亮的变化理解时间,而西方则用太阳的变化理解时间。

因此,对于大数据、数据、信息的定义和理解成为本书写作的一个大前提。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈