2 大数据是个“筐”,什么都能往里装
近年来,随着物联网、云计算、大数据、人工智能等前沿信息技术的高速发展,我们已然迈入大数据时代。数据被喻为大数据时代的石油,如何拥有继陆权、海权、空权之后的数权,已经上升为各国的重大科技战略。大数据除了描述一种数据规模形态,不同的组织和成员对大数据的需求和理解都可能不同,不同的研究机构和技术协会对大数据的定义也有差异。大数据可以说是一种社会现象,或一种方法论,或一套技术体系,或一种认知挖掘过程,很难有一个标准的定义。那大数据应用的目的是什么呢?一般来讲,就是通过采集、存储、挖掘和分析海量的非抽样大数据集进行辅助智慧决策支持,即使很多情况下并不具备全量数据的采集条件,很多时候基于抽样的或局部范围的大数据集分析也是具有应用价值的。
大数据技术业务概览
大数据整个技术体系纷繁复杂。比如,大数据源的采集如果基于传感器,则离不开物联网,如果用智能手机,则离不开移动互联网;大数据海量存储要具备高扩展性,就离不开云计算的支持;大数据计算处理采用的机器学习、深度学习建模存在性能瓶颈,需要做并行计算和分布式计算扩展;大数据要互动展示、辅助决策,则离不开数据可视化技术的支持。另外,面向行业的大数据分析有金融大数据、交通大数据、医疗大数据、政务大数据、电商大数据、工业大数据……面向多模态数据的大数据分析有文本大数据、图像大数据、视频大数据等。总之,大数据应用涉及的相关业务和技术范畴十分广泛(见图1-2)。
图1-2 大数据不完全技术和业务概览图
为什么叫大数据智能
为什么本书主题定为“大数据智能”(Big Data Intelligence, BDI)?虽然大数据范围很广,但其终极目标,可以说是利用一系列前沿信息技术实现海量数据条件下的人类深度洞察和决策智能化,最终走向普适的人机融合!这不仅是传统信息化管理的扩展延伸,也是人类社会发展管理,甚至是运作方式智能化的核心技术驱动力。换句话说,数据大不等于大数据,大数据本身只是集成的数据集,没有特定的应用场景,没有智能算法的支持,除了提供基本的信息查询和检索之外,大数据本身很难产生更多的附加价值。所以,大数据智能代表的是大数据和人工智能的深度融合,通过大数据的智能学习、挖掘和分析,面向过去,发现数据规律,归纳已知;面向未来,挖掘数据趋势,预测未知,从而提高人们对事物的理解和决策处置能力,最终实现各行各业的普适智能。不管是商业智能、机器智能、人工智能,还是智能客服、智能问答、智能推荐、智慧医疗、智慧交通等相关应用、技术和系统,其本质都是在朝着这一目标演进。