第一篇 数据分析的方法
数据分析已然成为当下最热门的运营技能,大有“不会数据分析都不好意思和别人打招呼”之势。回顾我十多年大数据工作中所经历的行业,包括通信企业、智慧城市运营商、国内顶尖互联网公司以及金融企业,他们都对数据分析有着较高和迫切的要求。特别是近些年参加行业论坛、互联网分享会和开发数据分析培训课程时,能感觉到大家对于数据分析有着很旺盛和迫切的需求,也能明显感觉到大家对于数据分析有一些共性的疑问:
■ 如何入门数据分析?
■ 如何掌握有效的数据分析方法?
■ 如何成为厉害的数据分析师?
■ 数据分析一定要会Excel、SQL和Python?
我相信这些问题也代表了大多数读者的疑问。事实上,学习数据分析有一套非常科学的方法。这个学习方法要求我们首先掌握一种数据分析的流程、思路和方法,并学习这个流程、思路和方法由哪些步骤组成,每个步骤用到了哪些分析技术,以及这些分析技术的适用场景是什么。在掌握这个数据分析流程、思路和方法的基础上,我们再寻求一个合适的数据分析工具来实现和执行这些流程、思路和方法。
这种学习方法的好处有以下几点。
第一,掌握一个科学的分析方法之后,再寻求一种合适的分析工具,可以让我们分析数据的效率大幅度提升。
第二,避免出现本末倒置,也就是学完语言,学完算法,具备一定的编码能力后,回到工作岗位中依然不知道从何下手,在学习技能和应用技能之间出现了巨大的断层。出现断层的原因就是我们虽然学习了工具,但是没有掌握应用工具的思路和方法。
基于此,本篇为大家带来一套有趣、有效、有料的数据分析方法。
首先,这套数据分析方法适用性非常广,不仅适用于互联网产品,也适用于线下业务,而且这套数据分析方法难度非常低,所应用的知识也只是大学期间统计学中的部分基础内容,可谓“简约但不简单”。
其次,选择Excel作为这套数据分析方法的落地工具,原因在于我国Excel普及率非常高,可以说99%的公司和个人都在使用Excel。并且,在Excel中实现这套数据分析方法,绝大多数情况下只需点点鼠标即可完成,极个别特殊场景才需要更高级的函数来辅助,所以特别适合产品、运营、市场、营销、销售、管理等从事业务运营的读者,基本上可以做到3分钟即了解,5分钟即掌握,10分钟即熟练。
最后,每个数据分析的方法都列举了实际工作和工程应用案例,通过实际案例的拆解分析,让读者更有代入感和共鸣,尽可能降低学习与应用之间的门槛,真正做到即学即用。
数据分析的完整流程包括3个主要步骤,分别是:
■ 寻找并准备数据:如何收集、处理与清洗数据;
■ 从数据中寻找问题的答案:如何进行数据分析与建模;
■ 用分析支撑决策:如何从数据中洞察业务并输出结论。
先说说这个流程的特点:
闭环,从业务中来,到业务中去。数据分析的结果可以在闭环中落地执行,在执行中验证效果,并执行新一轮的闭环分析。
通用,普适。从上述步骤的描述上看不出与任何行业、产品相关的词汇,意味着这几个步骤是行业通用和业务普适性的。既可以用这套分析方法分析电商产品的商品运营、供应链运营、渠道运营、品牌运营和用户运营,也可以用这套分析方法分析内容产品的内容消费情况,以支撑内容的热点运营、平台运营、品牌运营等。
在详细拆解每个步骤的内容前,我们先快速概览一下这3个步骤的主要特点以及使用场景。
1.寻找并准备数据:如何收集、处理与清洗数据
寻找并准备数据,主要阐述数据预处理工作。正所谓磨刀不误砍柴工,通过数据预处理,我们抹除脏数据、移除空白数据,将数据格式统一,目的是在提升数据质量的同时规范所有的数据指标,以方便后续分析,降低分析难度,提升分析速度。
例如,原始数据中日期格式是日-月-年,而我们的要求是年-月-日,两者格式并不统一,必须通过数据预处理进行格式转换。
例如,原始数据中存在空白值和特别大或特别小的值,不做预处理的话会导致分析结论出现偏差甚至错误,所以必须进行数据预处理。
在这个部分,我们用Excel进行数据预处理。
2.从数据中寻找问题的答案:如何进行数据分析
在数据预处理之后进入最主要的分析步骤,即从数据中寻找问题的答案。在这里将阐述5种数据分析的方法,即用描述性统计寻找数据整体和表象特点,用变化分析寻找数据分析的切入口,用指标体系来寻找变化的原因,用相关性分析判断原因的影响程度,用趋势预测来分析数据未来的发展趋势。
这5把利器既可以按照顺序使用,也可以拆解出来单独使用,由此体现了这套数据分析方法的灵活性所在。
在这个部分,我们依旧用Excel来实现这5把分析利器的作用,而且只需要掌握Excel的基本操作即可,不需要VBA、函数等高级技能。
3.用分析支撑决策:如何从数据中洞察业务并输出结论
通过上述数据分析武器寻找出来指标数据背后的原因以及发展趋势之后,还需要进一步将结果从数据转化为运营策略。在这里提出一种Business-Operation模型,借助Business-Operation模型将数据分析结果转化为可落地的运营策略。
注意:数据报表和数据分析报告的技巧不在本书中展开,请同学们自行搜索学习。