Preface 前言
为什么会写这本书
数据指标体系是数据分析师基于对业务的理解,从BI工具入手将多个相关的数据指标通过一定规则组织起来的、反映业务发展现状的评价体系。构建数据指标体系是数据分析师日常工作的重要组成部分。厘清各类数据指标之间的联系以及整合多个数据指标使其变成有联系的整体,以形成一套可以监控业务的体系,是数据指标体系构建的主要过程。在数据指标体系的构建过程中,掌握BI工具是基础,依靠对业务的理解提炼数据指标,形成监控体系并分析数据异动原因是数据指标体系为业务赋能的重要体现。因此,构建数据指标体系不仅需要掌握BI工具,更需要理解业务,对数据有较高的敏感度。
市面上大部分与数据指标体系相关的书籍都仅介绍BI工具的使用方法,能够将数据指标体系构建全流程融为一体的书籍少之又少,于是我萌生了写一本以数据指标体系构建为主线的数据分析相关书籍的想法。前期我在自媒体上对数据分析文章的分享以及2022年《数据分析之道————用数据思维指导业务实战》的出版为本书的写作奠定了坚实的基础,最终在孙海亮老师的邀请下我开启了本书的写作历程。
本书的读者定位
本书适合以下几类人群阅读:
• 工作1~3年的初级数据分析师。
• 数据分析初学者以及其他行业想要了解数据分析及指标体系构建的数据分析爱好者。
• 数据科学行业的人力专家和猎头(用于评估候选人的数据分析能力)。
本书的特色
本书以数据指标体系构建为主线,将数据指标规划、数据指标体系的框架设计、数据采集加工以及数据指标体系的应用等数据指标体系构建全流程融为一体。全书共5篇12章,由浅入深地介绍了一套通用的数据指标体系构建方法论,分享了已在多个行业实践的数据指标体系构建方法,同时从数据源获取出发,基于BI工具————Superset手把手教学数据指标体系构建,并结合统计学知识以及Excel、Python等工具分析数据指标异动原因及其对大盘的贡献度,实现数据指标体系赋能业务。
第一篇是着重介绍数据指标体系的基础知识,包括数据指标的定义、数据指标的分类、好的数据指标的评价标准以及多个零散的数据指标如何整合成一套完整的数据指标体系。
第二篇着重介绍数据分析师在数据指标规划阶段的工作内容,即根据业务目标进行拆解,抽象出能够衡量业务现状的关键指标,同时确定指标的统计口径以构建数据指标字典,包括用户规模数据指标、用户行为数据指标、业务数据指标以及数据指标的分析维度。
第三篇着重介绍数据指标体系的框架设计,其中包括一套以“目标化、模块化、流程化、层级化、维度化”为基础的数据指标体系构建方法论,以及职场在线教育、电子阅读工具、图文内容社区、网约车、社交电商行业数据指标体系实践方案。
第四篇主要介绍数据采集和加工,包括如何通过数据埋点获取数据指标体系构建所需的原始数据,以及获取原始数据后如何通过数据加工清洗完成数据指标开发及数仓模型构建。其中数据指标开发及数据仓库模型构建阶段的大部分工作都由数据仓库开发工程师完成,数据分析师对这部分内容仅了解即可,因此本篇也只会对相关内容进行概括性的介绍。
第五篇介绍数据指标体系的应用,包括使用BI工具实现数据指标体系的构建,以及数据指标体系如何在实际场景下指导数据异动分析。本篇内容会从BI工具的安装出发,详细教学BI工具各个子模块的使用方法,并通过实际案例完成数据指标体系的构建,同时介绍数据指标体系如何监控业务异动,定位异动原因,以及计算指标异动对大盘的贡献度。
数据指标体系的构建并不是一蹴而就的,本书会总结数据指标体系构建方法论,同时分享实践案例以引导读者完成BI工具的使用和简单的数据指标体系构建。当然这是远远不够的,掌握构建数据指标体系以及分析数据异动原因最好的方式是在实战中积累和总结。本书只是抛砖引玉为读者建立一个系统框架,最终还是需要读者在自己的工作中进行实践和积累。
勘误与支持
由于我的水平有限,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。读者可以将发现的错误、不准确的描述、代码bug、文字问题及有疑惑的地方通过邮箱574233829@qq.com或者公众号“数据万花筒”反馈给我,我会及时解答。可在微信搜索页面搜索“数据万花筒”,或在公众号搜索页面搜索“DataArtScope”关注我的公众号。
致谢
本书是我在长期的工作中总结出来的经验和方法,所以我首先要感谢从实习到正式工作这几年陪我一路走来的同事们,没有他们的指导和付出也就没有我的成长!
其次,感谢父母,他们给了我生命,给了我受教育的机会,在困难和挫折面前鼓励我,帮助我,因此才有了今天的我。
当然,也要感谢公众号的读者,他们的支持让我有了持续更新技术文章的动力,也才有了这本书的出版!