第一章 R语言介绍
1.1 工作空间:workspcae
工作空间(workspace)就是当前R的工作环境,它存储着所有用户定义的对象(向量、矩阵、函数、数据库、数据框、列表)。在一个R会话结束时,你可以在当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。
例1:
1.2 输入和输出
1.2.1 输入
函数source(“filename”)可在当前会话中执行一个脚本。如果文件名中不包含路径,R将假设此脚本在当前工作目录中。
例:
source("myscript.R") # 执行包含在文件myscript.R中的R语句集合
1.2.2 文本输出
函数sink(“filename”)可在当前会话中执行一个脚本。默认情况下,如果文件已经存在,则它的内容将被覆盖。
- 使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它。
- 参数split=TRUE可将输出同事发送到屏幕和输出文件中。
- 不加参数调用命令sink()仅向屏幕返回输出结果。
1.2.3 图形输出
虽然sink()可以重定向文本输出,但它对图形输出没有影响。要重定向图形输出,使用一下函数。最后使用**dev.off()**将输出返回到终端
1.3 包
1.安装包
install.packages("需要安装的包名")
2.更新包
update.packages("需要更新的包名")
3.查看已安装包的描述
installed.packages("包名")
4.包的载入
要使用安装的包,需要先载入。
library(包名) # 这里不需要引号,安装需要
第二章 创建数据集
2.1 数据集的概念
数据集通常是有数据构成的一个矩形数组,行表示观测,列表示变量。如下:
- R中有许多用于存储数据的结构,包括标量、向量、数组、数据框和列表。
- R可以处理的数据类型包括数值型、字符型、逻辑型(FALSE/TRUE)、复数型、和原生型(字节)。
2.2 数据结构
2.2.1 向量:c()
- 向量是用于存储数值型、字符型或逻辑型数据的一维数组。
- 执行组合功能的函数c()可用来创建向量。
例1:创建向量
> a <- c(1,2,3,4,5,-1) # 数值类型 > b <- c("one", "two", "three") # 字符型向量 > c <- c(TRUE, FALSE, TRUE, FALSE) # 逻辑型向量
注意:单个向量只能是一种数据类型
例2:访问向量中的元素
> a <- c(1,2,3,4,5,-1) > a[3] # 第三个,索引从1开始,而不是0 [1] 3 > a[c(1,3,6)] # 第1,3,6个 [1] 1 3 -1 > a[2:6] # 第2到6个 [1] 2 3 4 5 -1
2.2.2 矩阵:matrix()
- 矩阵是一个二维数组,只是每一个元素都拥有相同的模式(数值型、字符型或逻辑型)。
- 可通过函数matrix创建矩阵
格式:
mymatrix <- matrix(vector, nrow=a, ncol=b, byrow=TRUE/FALSE, dimnames=list(r_name,c_name))
1.vector:包含了矩阵的元素
2.nrow:指定行数
3.ncol:指定列数
4.byrow:TRUE则按行填充;FALSE则按列填充;默认按列
5.dimnames:以字符向量表示行名和列名
2.2.3 数组:array()
- 数组和矩阵类似,但是维度可以大于2。
- 数组通过array()函数创建
形式:
myarray <- array(vector, dimensions, dimnames)
1.vector:包含了数组中的数据
2.dimensions:是一个数值型向量,给出了各个维度下标的最大值。(可选)
例:创建234的三维数组
2.2.4 数据框:data.frame()
- 可包含不同模式(数值型、字符型)的数据
- 可通过data.frame()创建
格式:
mydata <- data.frame(col1, col2, col3, ...) • 1
1.列向量col1,col2,col3可为任何类型(如字符型、数值型或逻辑型)
注意:每一列的模式必须唯一
注意:这里的$相当于python中的.
1. attach()函数
- 可将数据框添加到R的搜索路径中
2. detach()函数
- 将数据框从搜索路径中移除
- detach并不会对数据框本身做任何处理,这句是可以省略的,写上是一个好的编程习惯
2.2.5 因子:factor()
- 变量可以归结为名义型、有序型、连续型变量。
- 名义型变量:没有顺序之分的类别变量
- 有序型变量:表示一种顺序关系,而非数量关系
- 连续型变量:可以呈现为某个范围内的任意值,并同时表示了顺序和数量
- 类别(名义型)变量和有序类别(有序型)变量在R中称为因子(factor)
- 函数factor()以一个整数向量的形式存储类别值,同时一个由字符串组成的内部向量将映射到这些整数上
2.2.6 列表:list()
- 一些对象的有序集合
- 对象可以是任何结构
格式:
mylist <- list(object1, object2) # 你还可以对列表中的对象命名 mylist <- list(name1=object1, name2=object2)
2.3 数据的输入
2.3.1 使用键盘输入数据:edit()