上QQ阅读APP看书,第一时间看更新
1.2 大数据的特征
大数据具有以下4个基本特征:数据规模大、数据类别多、数据处理速度快、价值密度低。
1.数据规模大
大数据的基本属性是数据量巨大。目前,各个行业中的各个企业每天都会产生大量的数据,数据呈爆炸式的增长,数据量已从TB级别跃升到PB级别,甚至到了EB数量级。面对海量数据,传统的数据库系统处理能力已经难以应对,而且数据量仍在大规模增长,产生数据的来源也变得更加多样化。
2.数据类别多
大数据除了传统的商业活动产生的数据外,还包括互联网上社交媒体产生的文本数据及时刻产生的传感器数据等。数据类型除了结构化数据外,还有半结构化和非结构化数据,如图片、网页、视频等,数据种类繁多。
3.数据处理速度快
大数据和传统数据挖掘最显著的一个区别就是大数据要求处理速度快。面对如此大规模的数据,有效处理数据的效率也就牵系着企业的命运。对数据的实时处理、分析及反馈变得十分重要,创建实时数据已经成为一种趋势。
4.价值密度低
价值密度往往与数据量成反比,在大量数据中有用的信息可能是非常少的,而且要有效地获取这些有用的信息也是比较困难的。比如,连续的监控产生大量的视频信息,而我们需要的数据可能就只有一两秒。针对大数据价值密度低这一特征,如何有效地挖掘出其中有用信息变得尤为重要。