开发者学堂课程【R 语言编程基础:R 的安装、获取帮助、工作空间管理】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/564/detail/7713
R 的安装、获取帮助、工作空间管理
内容介绍
一、R 的获取与安装
二、通过一个例子了解 R 的使用
三、R 如何获取帮助
四、R 的工作空间管理
一、R 的获取与安装
1、R 的获取直接可以从互联网中进行下载,在浏览器中输入 R。
2、进入 R 的主页,这里有里很多 R 最新的消息和新闻。
3、点击 downloadR,可以看到有很多的镜像。
4、点击其中一个镜像,进入镜像可以看到 R 有三个版本,linux、mac、windows,这次主要针对的是 windows 版本的安装和使用,所以点击 windows 版本 R 的下载。
5、第一次使用点击 first time。
6、这里显示 R 的最新版本是3.2.3,点击进行下载。
7、点击已经下载的 R 进行安装,选择默认的安装路径,选择32位,一直点击下一步即可,创建一个桌面的快捷方式。
8、安装完成后,双击使用它。
二、通过一个例子了解 R 的使用
1、在使用 R 之前先看一下 R 的界面,左边是一个命令框,里面有一个向右的小的箭头,上面有一个提示符,就是输入 R 命令的地方,R 有很多种数据类型,包括向量,矩阵,数据框以及列表,列表 list 可以放很多各种各样的对象集合,之后会进行相应的介绍。R 有很多功能,存续,内置,函数以及和用户自己编写的函数所提供的,一次交互式的会话,现在所展示的就是一次交互式会话,期间所有的数据对象都会被保存在内存中,R 的执行速度跟电脑的内存大小是有很大关系的,R 有些基本函数是默认直接可以,如果使用 R 更高级的函数,则需要加载包含这些高级函数的程序包。
2、R 的语句是有函数和赋值所构成的,R 赋值的过程中使用的是向左的箭头,比如 x<-rnorm(s)一个赋值语句,创建了一个名为 x 的向量,它包含了五个来自标准正态分布的随机偏差,x 具体的值0.9584945,1.0284146,0.8384001,-1.2982364 -0. 6522694,这就是五个遵循标准正态分布的随机偏差,它允许使用等号进行复制,也可以给x赋值,但是这样给 x 赋值的程序员不是很多,如果使用这种方式给 R 赋值会显的特别不专业。可以使用命令ls查看当前环境下存储的变量值,在当前环境下就存储了一个变量 x。
3、10名婴儿的月龄和体重,具体数值如下:
年龄(月) |
体重(kg) |
年龄(月) |
体重(kg) |
1 |
4.4 |
9 |
7.3 |
3 |
5.3 |
3 |
6.0 |
5 |
7.2 |
9 |
10.4 |
2 |
5.2 |
12 |
10.2 |
11 |
8.5 |
3 |
6.1 |
婴儿体重的分布和婴儿月龄的关系,通过 R 挖掘它们的关系。
(1)首先创建数据集,R 进行赋值时,通常会使用一个 c 括号的形式对变量进行赋值,首先把婴儿的月龄赋值到age这个变量中,
age <- c(1,3,5,2,11,9,3,9,12,3),再把体重赋值到 weight 变量中,weight<-c(4.4,5.3,7.2,5.2,8.5,7.3,6.0,10.4,10.2,6.1)。
(2)使用一个函数 mean 求得这些样本数据,婴儿平均的体重,平均体重是7.06。
Mean
(weight)
7
.
06
(3)还有一个函数可以求它们体重的标准差,体重差是2.077498。
sd
(weight)
2
.
077498
(4)求出这两个变量数据后,看年龄和体重之间的关系,可以使用的函数是 cor,它们是否存在线性关系,得到年龄和体重的相关度接近0.91,说明婴儿的月龄和体重有非常强的线性关系。
Cor
(
age
,weight)
0
.
9075655
(5)也可以用图进行说明。R 画图的命令是 plot(age,weight)。
下边是 age,上面是 weight。
整个婴儿体重的分布,它和月龄是遵循一个线性的关系。R 有非常强作图的功能,
(6)输入 demo,它会显示 demo 这个函数是在 base 包里面,当前环境下是没有安装这个包的,可以通过其他命令,进行使用。
Demo
()
Demo
(
garphics
)
以下就是 R 画的图,点击还可以看到 R 可以画饼图。
柱状图。
曲线图。
所以 R 的作图功能是非常强大的。
三、R 如何获取帮助
在使用过程中如何查找帮助文件?R 获取帮助的命令有很多,比如第一种 help.start(),这可以打开 R 帮助文档的首页,离那么有 introduction 这些内容。
但是 help.start()这个还不够直接,比如使用的 mean 函数求平均值,如果不知道这个函数它能实现什么功能,或者有什么样的参数,可以使用 help(‘’mean‘’),就可以进入到帮助界面。mean 是属于 base,有它的描述,包括它如何使用参数,以下就是参数的一些说明,最下面有函数的具体例子。
还有一中更便捷的方式,比如查找函数另一个使用方式,直接输入?Mean,一样可以切换到帮助页面。
四、R 的工作空间管理
1、R 的工作空间就是 R 的工作环境,在这个环境中它储存着所有用户定义的对象,包括向量,矩阵,函数等等,可以看一下当前的工作目录,输入 getwd(),当前命令在"C: /Users/ YH/ Documents"文档下面。
2、如果想把变量或者历史文件,存放到其他的工作空间里面,可以输入 setwd(),输入想存放的路径"C: /Users/",再输入 getwd()查看当前的工作空间,已经改成了 C: /Users/。再改回原来的存放路径。之后希望养成某一项目单独的设定工作空间的习惯,因为如果在使用R的过程中,每一个项目都是用同一个工作空间,那么每次打开都会把那些不相关的其他项目的变量加载进来,而且变量名是不能 c 重复的,所以在这个过程中会造成很大的麻烦,比如在定义变量时,还需要考虑这个变量是不是已经有了,已经存在,在替换时会影响到其他项目的使用,而且随着项目越来越多,把所有的项目放在一个工作空间,会导致 R 启动时加载的变量越来越大,会使 R 加载的速度就会变慢,占用大量的内存后,R 执行效率也会降低,所以要养成项目单独的设定工作空间的习惯。
3、在 R 中有一个很有用的命令,history(),就可以看到刚刚输入的那些命令,这些命令也非常有用,因为在执行某一个工程时,如果有一段时间没有用它,如果再去执行它,会发现整个工程都要重新思考或者重新做一个规划,如果把这些操作的过程保留下来,之后再使用这个工程时,就可以根据历史的记录去输入命令即可。history 默认保存在C: /Users/ YH/ Documents.history 文件中,也可以把 history 命令保存到其他目录。