1.4.1 必备的Excel处理方法
对于一个数据分析师来说,日常中的大部分工作内容是可以结合Excel和SQL完成的。Excel用于数据的加工以及处理分析,SQL用于数据的查询。作者也曾咨询过很多圈内的朋友,他们在工作中具有相似的模式,即Excel和SQL。庆幸的是,这两款工具学习起来相对较为容易。在作者看来,困难的是如何灵活地应用Excel技巧和梳理好SQL的取数逻辑来提高工作效率。
Excel非常重要,它不仅仅是一个存储数据的容器,用户还可以借助其强大的函数、透视表、可视化、VBA等功能帮助其完成大量的数据分析工作。这里不妨罗列一些常用的Excel函数。例如,统计函数(COUNT、COUNTA、COUNTBLANK、COUNTIFS、SUM、SUMIFS、AVERAGE、AVERAGEIFS、MAX、DMAX、MIN、DMIN、MEDIAN、SUMPRODUCT、VAR.S、SKEW、NORM.DIST等)、字符串函数(LEN、LENB、LEFT、RIGHT、MID、UPPER、LOWER、FIND、SEARCH、SUBSTITUTE、REPLACE、CONCATENATE、EXACT、TRIM等)、数值函数(RAND、RANDBETWEEN、ABS、MOD、POWER、PRODUCT、CEILING、FLOOR、ROUND、ROUNDUP、ROUNDDOWN等)、逻辑函数(AND、OR、NOT、IF、IFERROR、ISTEXT、ISNUMBER等)、日期和时间函数(TODAY、NOW、YEAR、MONTH、DAY、HOUR、MINUTE、SECOND、DATE、TIME、DATEDIF等)、匹配查找函数(CHOOSE、VLOOKUP、HLOOKUP、LOOKUP、MATCH、INDEX、OFFSET、INDIRECT等)。读者如果能够灵活地使用这些Excel函数,那么日常工作中的数据处理将会变得既简单又轻松。
此外,Excel中包含的强大的可视化功能(如饼图、条形图、柱状图、折线图、面积图、散点图、气泡图、雷达图等)也会为日常的数据分析助一臂之力(但Excel主要用于小数据集的处理,在于面对大数据时会显得力不从心,此时便无法与Tableau相媲美了)。
VBA属于Excel的编程部分,属于一种宏语言,它是由一系列的命令和函数组织起来的,利用强大的宏功能,可以避免大量重复性工作,从而节约时间,提高工作效率。尽管VBA在工作中使用的频率并不是很高,但如果一有机会,读者使用它来开发数据报表或进行表计算,会大大提高工作效率和成就感。有关Excel中的函数介绍、透视表应用、数据可视化和宏语言的编写,读者可以查阅本书第2章的内容。Excel宏脚本的操作界面如图1-22所示。
图1-22 VBA的操作界面