1.2.3 R包的获取与安装
这一小节,我们来介绍R中可大大拓展你的分析技能的利器——R包。
1.什么是R包,为什么要安装?
所谓R包,就是一个把R函数、数据、预编译代码以一种定义完善的格式组织在一起的集合(见图1-27)。
R在安装时会自带一系列默认包(包括base,datasets,stats,methods,graphics等),它们提供了很多功能丰富的函数与数据,大家可以自行调出学习,命令search( )可以告诉你工作空间里已有哪些包可直接使用。当然,如果需要装备更多、更厉害的拓展技能,就需要安装新包来实现了。
2.怎样安装包?
一般的安装做法有两种:一种是通过CRAN服务器安装;另一种是从Github下载安装,可作为第一种的补充。
第一种方法最常用。在RStudio中有两种方法实现:一种是直接通过命令装包:install.packages("package_name" );另一种是选中如图1-25所示的右下方界面中的Packages后,点击Install,就会弹出如图1-28所示的方框,直接在其中输入包的名称即可。
另外,细心的读者可能会发现这里竟然不能选择镜像!对,RStudio默认采用的是Global镜像,如果想换成本地镜像,可以点击“Tools→Global Options”,打开Options界面(见图1-29),在Packages选项卡中更换镜像。
第二种方法:通过Github安装。前面介绍过Github网站,新手建好包一般会先放在那里接受群众“检阅”,因此就有了一个下载新包的渠道——Github。一个R包在Github上的呈现如图1- 30所示。
这些包并不需要从网站下载再装进R,R里有一些方便与Github交互的包如devtools,其中的install_github( )函数就专为从Github安装包设计。下面以一个R包praise为例,它的安装语句如下:
需要注意的是,用此函数安装包时需在前面加上它的作者在Github上的用户名,此处praise包的作者用户名是gaborcsardi。
另外,一个包只要安装一次就可永久使用。当遇到包的作者进行了更新时,通过命令update.packages( ) 即可迅速检查并更新已经安装的包。RStudio中右下部分有一键更新包按钮。
安装好了包,只是把它放在本地硬盘里,用时需要打开才能调用它的函数。打开的方式很简单,选用以下函数之一即可完成。
4.如何用好一个包?
(1)寻找可用的包。对于包的选择,首先可以通过谷歌进行搜索,确定什么样的包符合你的要求;其次向大家介绍一个按照任务归类方法及包的地方:http://cran.r-project.org/web/views/(见图1-31),可以在其中寻找与你的研究相近的主题。
(2)在各种可用的包中如何选择? Crantastic网站(http:// www.crantastic.org/popcon)中有各种包的使用热度排名,可以作为参考。
(3)选择好合适的包后,如何使用呢?可以通过R中的帮助功能,即通过RStudio右下角界面的搜索框(见图1-32)。
另外,输入命令help(package="package_name")也会自动打开文档界面,里面既有对此包技能的整体描述、使用指南等文档,又有包内所含的函数列表。对于具体函数用法,直接点击函数名即可(见图1-33)。
(4)函数文档很长,从哪里看起呢?一般来说,从两个地方切入更方便:一是先读Description和Usage(见图1-34),整体了解函数基本功能及参数设置;二是帮助文档最后附带的Examples(见图1-35),把它复制粘贴进编辑器,反复运行体会每个参数的含义。当然,如果需要更深入透彻地理解函数,就要弄懂术语,理解其中每个参数的用法,这是高手的进阶之路。