首页 百科知识 数据的海洋

数据的海洋

时间:2022-08-25 百科知识 版权反馈
【摘要】:有统计表明,截止到2012年,整个人类文明所获得的全部数据中,有90%是过去两年内产生的,而到了2020年,全世界所产生的数据规模将达到今天的44倍。与过去手工输入的数据如财务数据、调查表格等有所不同,现在的大量数据由网络或者机器产生。它是指数据生成的速度,互联网上数据的生成速度是以秒甚至毫秒来计算的,除了用户在使用网络时产生数据外,还有各种仪器所生成的数据,比如基因测序仪、监控视频等。

在信息科技高度发达的今天,多大的数据量才可以称为大数据?

互联网在一天之中所产生的全部内容,可以刻满1.68亿张大容量光盘;交往的邮件有2940亿封;发表的文章达200万篇,相当于《时代》杂志770年的文字量;每一秒钟所产生的视频,可以供一个人连续观看15年……

目前,家用电脑所使用的硬盘大多还是以TB做为容量单位,而信息的计量单位,已经由TB跃升到了PB、EB乃至ZB。有统计表明,截止到2012年,整个人类文明所获得的全部数据中,有90%是过去两年内产生的,而到了2020年,全世界所产生的数据规模将达到今天的44倍。

有人这样定义大数据:“大数据”是指在可承受时间范围内,无法用现有的常规软件进行捕捉、管理和处理,具有大规模、多样化和高增长率的信息资产,它需要新的处理模式才能具有实际应用的价值。

一般来说,大数据具有以下特征:

首先是大量。与过去手工输入的数据如财务数据、调查表格等有所不同,现在的大量数据由网络或者机器产生。比如某搜索引擎每秒钟会处理超过4万条的搜索,相当于每天35亿条。

其次是多样。多样是指不同的数据来源和数据种类,与传统的“数字”不同,现在的数据包括了我们所能看到或听到的所有信息类型,比如文字、数字、图像、音视频等,它们通过诸如空间日志、软件操作、社交平台、网络搜索、手机短信或通话记录、以及各种监控设备而产生。

最后是速度。它是指数据生成的速度,互联网上数据的生成速度是以秒甚至毫秒来计算的,除了用户在使用网络时产生数据外,还有各种仪器所生成的数据,比如基因测序仪、监控视频等。另外,全世界安装在无数工业设备上的数码传感器,也在随时测量并传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化等海量数据。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈