地球科学中的大数据分析与挖掘算法手册
上QQ阅读APP看书,第一时间看更新

序二

随着数据采集、存储技术的迅猛发展,以及软件应用技术的日新月异,海量的、复杂的、动态变化的数据——“大数据”已成为我国未来十年的重要科研方向和支柱产业。长期以来,人们常常使用数据挖掘的方法从海量的数据中寻找数据间存在的内在规律、模式、隐藏的知识和价值。然而,在大数据的背景下,已有的这些数据挖掘方法和技术在计算效率、复杂度、可扩展性、适用性等方面都存在较大的局限性,不能满足大数据挖掘的实际应用要求。因此,大数据挖掘是当下最为活跃的研究领域,新算法层出不穷,也是未来计算机信息领域的重要研究方向。

相对于一般的商业、事务、互联网等数据,地学数据更为复杂,涉及地理、天文、空间、大气、海洋、生态、地质等基础学科,包含位置数据、属性数据、空间关系数据等。随着遥感技术的发展,数据的类型也越来越复杂,既有矢量数据,也有栅格数据,还有海量的遥感影像数据。而目前的大数据挖掘研究较少考虑地学数据独有的特征。因此,将计算机科学的大数据挖掘原理、方法、技术与地学数据的特征紧密地结合起来,是一项十分有意义的工作。人们期待着能够从汪洋大海般的地学数据中及时有效地挖掘出有用的、高附加值的知识,为决策服务。

本书的可贵之处在于,这是第一本关于地学大数据挖掘的书籍。撰写团队集多年来的数据挖掘、地学数据分析的智慧与学术界的优秀成果于一体,熔炼成一本算法手册,强调先进性、系统性、可读性、可操作性。本书的可读之处颇多,既包含面向地学大数据的关联规则挖掘、分类、预测、聚类等算法,又包含崭新的深度学习技术、遥感图像识别技术等,并附以多个地学应用大数据的实例等。纸短笔陋,实难尽述。

通过阅读本书,计算机科学的读者可以了解地学知识、地学数据特点;地球科学的读者可以学习到数据挖掘技术,特别是大数据挖掘的技术;数据挖掘专业的读者可以发现地学大数据的独特魅力;大数据专业的读者可以发现潜在研究空间和发展空间。总之,阅读本书,无论对数据挖掘的学习者,还是对地学研究人员,还是对大数据、数据挖掘软件开发人员都是大有裨益的。

石勇[1]
2017年4月10日于北京


[1]发展中国家科学院院士