R语言:从数据思维到数据实战
上QQ阅读APP看书,第一时间看更新

1.1.2 为什么要使用R语言?

R语言让人爱不释手的出色特征可以概括为:物美价廉,兼收并蓄,是集万千力量于一身的优秀软件。

1.物美价廉——作图颜值高且完全免费

物美,主要体现在卓越的作图功能。点图、线图、柱状图、直方图,R语言样样精通,而且设计感非常好。比如可以画如图1-7所示的图。

picture

图1-7 R作图示例(1)

如果对R中的基本图形稍作修饰,还能把聚类结果画成如图1-8。

picture

图1-8 R作图示例(2)

更可以把北京出租车轨迹图画成如图1-9。

picture

图1-9 R作图示例(3)

R语言可挖掘的有趣的东西太多,任由你发挥创意。更为重要的是,它完全免费!它是世界各地有开源精神的极客们共同贡献的精品。

2.兼收并蓄——算法覆盖广,软件扩展易

(1)算法覆盖广。作为统计分析工具,R语言几乎覆盖整个统计领域的前沿算法。从火爆的神经网络(下围棋的机器狗脑袋里的东西)到经典的回归分析(见图1-10),数千个R包,上万种算法,你都能找到可直接调用的函数实现。

picture

图1-10 回归分析与神经网络

(2)软件扩展易(见图1-11)。作为一款软件系统,它有极方便的扩展性。如果数据原来存在Oracle中,可轻松导入;如果数据在MySQL中,照样解决。文本文件、数据库管理系统、统计软件、专门的数据仓库等都可兼容。同时,它可以将数据输出并写入这些系统中,甚至能轻松与各种语言完成互调,比如Python,C,都可无缝对接。

picture

图1-11 R与其他语言

3.集万千力量于一身——强大的社区支持

作为一款开源软件,R背后有一个强大的社区和大量的开放源码支持,获取帮助非常容易。比如国外比较活跃的社区有Git Hub和Stack Overflow等,通常R包的开发者会先将代码放到Git Hub,接受世界各地的使用者提出问题、修改代码等操作,等代码成熟后再放到CRAN上发布;而Stack Overflow则是一个优质的IT技术问答网站,当你通过谷歌搜索R问题时,通常会看到该网站的回答排在首位,可见该网站的搜索热度有多高。而国内最活跃的R社区当属统计之都以及统计之都旗下的COS论坛,统计之都经常发布与R相关的优质文章,还会不定期举办线下研讨会,以及规模巨大的中国R语言大会(见图1-12);COS论坛则是中文R语言技术问答社区。它们都对R语言学习者具有很高的参考价值。

picture

图1-12 王汉生教授在中国R语言大会上发言