本节书摘来华章计算机《数据驱动安全:数据安全分析、可视化和仪表盘》一书中的第2章 ,第2.2.2节,[美]杰·雅克布(Jay Jacobs)鲍布·鲁迪斯(Bob Rudis) 著 薛杰 王占一 张卓 胡开勇 蒋梦飏 赵爽 译, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.2.2 设置R语言环境
你需要下载安装R(http://cran.rstudio.com/),Rstudio(www.rstudio.com/ide/download/),来构建R/RStudio环境。所有的链接都有Linux、Windows、Mac OS X操作系统的安装细节,在这里我们不再浪费时间。你需要做的仅仅是在安装RStudio时选择桌面还是服务器模式,它们都包含一样的核心特性。
- 内置的IDE
- 数据结构和工作空间探索工具
- R控制台的快速访问
- R帮助界面
- 图形画板界面
- 文件系统浏览器
- 包管理器
- 集成版本控制系统
它们的主要区别是:一个是单用户产品(RStudio Desktop);另一个(RStudio Server)是装在服务器上,可以通过浏览器访问,使多用户可以利用计算设施的优势。假设你不熟悉R或者R Studio,可以马上下载安装RStudio Desktop(本书所有涉及RStudio例子都是桌面版完成的)。
如果受限要使用商业版的工具,Revolution Analytics(www.revolutionanalytics.com/support)提供商业版本和对R的技术支持服务。
安装好之后,打开RStudio,你会看到默认的工作空间,如图2-4所示。
都搞定之后,你需要花一些时间读读Paul Torfs和 Claudia Brauer写的《A (Very) Short Introduction to R》(http://cran.r-project.org/doc/contrib/ Torfs%2BBrauer-Short-R-Intro.pdf)。这能让你对于R语言以及R Studio环境有足够的基本掌握。
虽然可以用RStudio内置的包管理器去安装包,但是使用控制台会更方便。可以通过安装ggplot2包熟悉这一流程,它是本书例子中使用的主要图形库。当你在RStudio控制台敲入以下命令时,安装就会开始。
执行以下代码确认ggplot2安装正确以及R/RStudio环境正常:
假如没有出错,你看到如图2-5所示的柱状图,说明你的环境已经准备好了,可以运行本书的所有例子。假如遇到错误,尝试仅仅用R控制台(不是RStudio)重新安装ggplot2,执行上述柱状图代码。假如运行正常,卸载并重装RStudio以解决这个错误。
同Python一样,R语言也有许多有用的库可以简化任务。我们会在后续章节陆续介绍,你也可以细读Comprehensive R Archive Network(CRAN)(http://cran.r-project.org/web/packages/),上面有很多开发者开发的库。
关于R版本
本书的R例子都是在R 3.0版本下创建的,有些包管理器仍旧将2.15版本作为默认版本。建议你从本章提供的安装资源安装R,确保本章后续用到的包的最大兼容性。