本节书摘来自华章计算机《R语言数据分析与挖掘实战》一书中的第2章,第2.1节,作者 张良均,云伟标,王路,刘晓勇,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
第2章
R语言简介
R语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(Bell Laboratory)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现,提供了一系列统计和图形显示工具。它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。它具有下列优势:
1)作为一个免费的统计软件,R可运行于多种平台之上,包括Windows、UNIX、MacOS和Linux。
2)R可以轻松地从各种类型的数据源导入数据,包括文本文件、数据库管理系统、统计软件,乃至专门的数据仓库。它同样可以将数据输出并写入到这些系统中。
3)具有较高的开放性,R不仅提供功能丰富的内置函数供用户调用,也允许用户编写自定义函数来扩充功能。
4)R拥有顶尖水准的制图功能。如果希望复杂数据可视化,那么R拥有最全面且最强大的一系列可用功能。
R是一个体系庞大的应用软件,主要包括核心的R标准包和各专业领域的其他包。R在数据分析、数据挖掘领域具有特别优势,本书针对数据分析和挖掘相关的内容采用原理加实战的方式对R相关函数进行介绍。本章主要对R软件的安装,一些数据分析和挖掘相关的包,以及常用函数的使用进行简单介绍。后续的原理章节中,首先介绍数据挖掘分析的相关原理,然后针对每个原理选取R相关函数进行实战演示,使读者不仅对数据挖掘相关原理有比较清晰的认识,同时可以使用本书提供的R相关实例来切实地感受相关数据挖掘原理的精髓。
2.1 R安装
本书使用的R版本为R 3.2.0。根据操作系统不同,可选择安装64位或32位版本。安装时直接运行下载的R-3.2.0-win.exe。R可以在其主页(http://www.r-project.org/ )上的R综合资料网(Comprehensive R Archive Network,CRAN)获得。Linux、Mac OS X和Windows都有相应编译好的二进制版本,根据你所选择平台的安装说明进行安装即可。
安装好R后,点击安装目录中bin目录下的Rgui.exe启动R,打开如图2-1所示的界面。
为了方便使用R,可使用免费的图形界面编辑器RStudio,可http://www.rstudio.com/products/rstudio/download/ 从中下载,请根据本机操作系统选择系统支持版本自行下载安装。安装RStudio后,可以选择从安装目录或者“开始”菜单栏中启动。