上QQ阅读APP看书,第一时间看更新
第2章 R语言数据可视化入门
按照第1章提到的逻辑,应该先介绍数据处理方面的内容,之后介绍可视化,但是考虑到平缓学习曲线,先介绍可视化部分相关的简单内容,便于读者保持学习兴趣。后面再介绍数据处理及相对深入的可视化内容。
本章介绍R语言可视化流行包ggplot2常见的图形及对应的运用场景。例子都尽可能精简,便于降低读者理解的难度。为了减少代码量,绘图时没有用过多的修饰成分,所绘图形显得相对粗糙。对于初学者学习,这个舍弃是有益的。后面章节会有完整的详细介绍,对这部分暂时舍弃的内容给予补充介绍。
使用ggplot2首先需要在脚本窗口输入library(ggplot2),将ggplot2加载到R运行环境。ggplot2绘图的核心结构:ggplot(数据集,aes(x=x轴要展示的变量,y=y轴要展示的变量))+geom_要绘制图形类别名称()。运行ggplot(数据集,aes(x=x轴要展示的变量,y=y轴要展示的变量))将会出现空白画布,之后通过geom_xx()添加几何对象并增加一个图层,二者通过加号连接,之后还可以通过加号增加需要的图层,并在其中绘制图形(也就是增加几何对象)。
对于ggplot2需要的数据集是数据框dataframe,读者可以理解为Excel中的表格,变量可以理解为表格中的列。本书以实用为主,因此列和变量、行和记录等概念经常混用。