对于非计算机行业人员来说,大数据或许只是一个高大上的名词,却并不明白大数据的定义和价值。那么大数据仅仅是指大量数据吗?然而事实并非如此简单,大数据不仅是指数据量大,同时还包含了大数据相关的采集、集成、管理、分析、解释等技术,是一个庞大且复杂的框架系统,甚至是推动各行各业发展的一种全新思维方式和商业模式。
大数据的定义是什么?
对于大数据的定义有很多,比如物理世界到数字世界的映射和提炼,通过对数据特征进行归纳梳理,从而提升效率的和决策可行性的广义定义,还有就是通过获取、存储、分析,从大容量数据中挖掘价值的一种全新的技术架构。
本文仅从狭义的技术角度去试着定义大数据,因此我们不需要思考物理世界到数字世界的映射关系,只需要简单地了解大数据可以做什么?(获取数据、存储数据、分析数据),其操作目标对象是什么?(大容量数据),有着什么样的目的?(挖掘价值)
对于获取数据、存储数据、分析数据这三项,很多人不禁反问我们每天对着电脑不就是做着这样一些列的事情么?但其实我们纯粹依靠人力可计算的数据量有多少,通过计算机技术的辅助又将数据计算量扩大了多少,而大数据则是处理传统个人电脑,常规软件都无力应对的量级数据处理。
目前大数据所处理的数据量级是以PB和EB为主,相比较这两个量级单位我们更熟悉的是MB、GB和TB,比如我们常听到电脑是500G或者1TB的硬盘容量。而他们之间的关系则是 1 TB等于1024 GB、1 PB 等于1024 TB 、1 EB等于1024 PB,如果还觉得1024的倍数不算大,那么再参考下1TB大约可以存储20万张照片或MP3音乐,1PB容量大约是2亿张照片或MP3音乐,在EB量级之上还有更大的单位ZB。