序
敏捷数据分析是相对于数据仓库和BI而言的新一代数据分析的思维框架和工具,相关变革已历经了一段时间,但就其范围、深度和影响而言才刚刚开始。新的工具不断出现,新的名词也层出不穷,如可视化分析、增强分析等,但数据分析变革的实质在于向敏捷转变,因为传统数据仓库和BI在适应创新业务方面的最大缺点是不够敏捷。数据分析的敏捷性可以概括为四点:业务导向、由小及大、迭代解析、增强展现。
“业务导向”和“由小及大”体现的是“敏”,具体来说就是为了追求某一业务结果从某一业务问题精确切入;“迭代解析”和“增强展现”体现的是“捷”,具体来说就是从一个小的表征问题,通过维度的试错和数据集的不断加载,完成数据探索,提出解决问题的方案。实际上,这里的“敏捷”远超出了“快”的一般意义,它体现的是敏锐地捕捉到“是什么”并精确描述,进一步简捷地解析“为什么”并释义因果关联。
上述的敏捷数据分析在实际应用中不仅需要思维的改变,还需要快速地完成从探索主题到数据集市的构建,进一步到分析画布的呈现。同时,底层支撑还需要有低技术门槛的数据集成能力和计算资源的配置能力。阅读本书可以基于Oracle的ADW和OAC获得对敏捷数据分析实现能力的导引,也可以对企业数据分析师进行进阶指导。
在过去的一年多时间里,史跃东所在的数据和分析团队在解决许多企业提出的数据分析需求的过程中一起讨论、研究和创建了不少敏捷分析的实例。史跃东对数据管理和分析有自己的见解,在团队研讨过程中把业务实例和技术实操结合起来,通过自己的研习形成了本书对ADW+OAC的系统阐述。
我在敏捷数据分析推动团队研究的过程中,感受到大家对数据管理的热爱和执着,本书也是作者在敏捷数据分析学习旅程中的一个成果,很高兴写序为谢。
——谢鹏 甲骨文公司副总裁及中国区技术顾问总经理
2021年3月于北京