首页 百科知识 大数据的特点和用途

大数据的特点和用途

时间:2022-10-05 百科知识 版权反馈
【摘要】:大数据中蕴含的宝贵价值成为人们存储和处理大数据的驱动力。因此,海量数据的处理和利用是大数据研究的主要目的。“啤酒与尿布”的故事是大数据挖掘的经典案例。大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。研究大数据的关键是应用。“未来3年,大数据市场规模将达到1万亿元。”

大数据中蕴含的宝贵价值成为人们存储和处理大数据的驱动力。《大数据时代》一书指出了大数据时代处理数据理念的三大转变,即要全体不要抽样、要效率不要绝对精确、要相关不要因果。因此,海量数据的处理和利用是大数据研究的主要目的。

“啤酒与尿布”的故事是大数据挖掘的经典案例。故事发生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难以理解的现象:在某些特定的情况下,啤酒与尿布这两种看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。

在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两种看上去不相干的商品经常会出现在同一个购物篮的现象。

如果这个年轻的父亲在卖场只能买到两种商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两种商品,而不是一种,从而获得了很好的商品销售收入。

从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种类型的数据中,快速获得有价值的信息的能力,就是大数据技术。

大数据分析相比于传统的数据仓库,具有数据量大、查询分析复杂等特点。大数据的特点有四个:

第一,数据体量巨大,从TB级别,跃升到PB级别。第二,数据类型繁多,如网络日志、视频、图片、地理位置信息等。第三,处理速度快,可从各种类型的数据中快速获得高价值的信息,这一点也和传统的数据挖掘技术有着本质的不同。第四,只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报。业界将其归纳为4个“V”——大量(Volume)、多样(Variety)、高速(Velocity)、价值(Value)。

物联网、云计算、移动互联网、车联网、手机、平板电脑、个人计算机以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。

大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。工程和科学问题尚未被重视。大数据工程指大数据的规划建设运营管理的系统工程;大数据科学关注大数据网络发展和运营过程中发现和验证大数据的规律及其与自然和社会活动之间的关系。

研究大数据的关键是应用。来自“2016全球大数据峰会”的报道说,大数据已经成为当下人类最宝贵的财富,但全球真正享受大数据红利的公司不足千分之一,人类已挖掘的数据财富更是不到百万分之一。而IT界大佬们对未来相当乐观。“未来3年,大数据市场规模将达到1万亿元。”阿里云总裁胡晓明在发布会上表示,基于阿里云大数据平台,将有千余家合作伙伴、万名首席数据官和5万位数据科学家诞生,把中国大数据市场规模拓展至万亿规模[6]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈