第一章 R语言介绍
1.1 工作空间:workspcae
工作空间(workspace)就是当前R的工作环境,它存储着所有用户定义的对象(向量、矩阵、函数、数据库、数据框、列表)。在一个R会话结束时,你可以在当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。

例1:

1.2 输入和输出
1.2.1 输入
函数source(“filename”)可在当前会话中执行一个脚本。如果文件名中不包含路径,R将假设此脚本在当前工作目录中。
例:
source("myscript.R") # 执行包含在文件myscript.R中的R语句集合
1.2.2 文本输出
函数sink(“filename”)可在当前会话中执行一个脚本。默认情况下,如果文件已经存在,则它的内容将被覆盖。
- 使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它。
- 参数split=TRUE可将输出同事发送到屏幕和输出文件中。
- 不加参数调用命令sink()仅向屏幕返回输出结果。
1.2.3 图形输出
虽然sink()可以重定向文本输出,但它对图形输出没有影响。要重定向图形输出,使用一下函数。最后使用**dev.off()**将输出返回到终端

1.3 包
1.安装包
install.packages("需要安装的包名")
2.更新包
update.packages("需要更新的包名")
3.查看已安装包的描述
4.包的载入
要使用安装的包,需要先载入。
library(包名) # 这里不需要引号,安装需要
2.1 数据集的概念
数据集通常是有数据构成的一个矩形数组,行表示观测,列表示变量。如下:

- R中有许多用于存储数据的结构,包括标量、向量、数组、数据框和列表。
- R可以处理的数据类型包括数值型、字符型、逻辑型(FALSE/TRUE)、复数型、和原生型(字节)。
2.2.1 向量:c()
- 向量是用于存储数值型、字符型或逻辑型数据的一维数组。
例1:创建向量
> a <- c(1,2,3,4,5,-1) # 数值类型
> b <- c("one", "two", "three") # 字符型向量
> c <- c(TRUE, FALSE, TRUE, FALSE) # 逻辑型向量
注意:单个向量只能是一种数据类型
例2:访问向量中的元素
> a <- c(1,2,3,4,5,-1)
> a[3] # 第三个,索引从1开始,而不是0
[1] 3
> a[c(1,3,6)] # 第1,3,6个
[1] 1 3 -1
> a[2:6] # 第2到6个
[1] 2 3 4 5 -1
2.2.2 矩阵:matrix()
- 矩阵是一个二维数组,只是每一个元素都拥有相同的模式(数值型、字符型或逻辑型)。
格式:
mymatrix <- matrix(vector, nrow=a, ncol=b, byrow=TRUE/FALSE, dimnames=list(r_name,c_name))
1.vector:包含了矩阵的元素
2.nrow:指定行数
3.ncol:指定列数
4.byrow:TRUE则按行填充;FALSE则按列填充;默认按列
5.dimnames:以字符向量表示行名和列名


2.2.3 数组:array()
形式:
myarray <- array(vector, dimensions, dimnames)
1.vector:包含了数组中的数据
2.dimensions:是一个数值型向量,给出了各个维度下标的最大值。(可选)
例:创建234的三维数组

2.2.4 数据框:data.frame()
格式:
mydata <- data.frame(col1, col2, col3, ...)
• 1
1.列向量col1,col2,col3可为任何类型(如字符型、数值型或逻辑型)

注意:每一列的模式必须唯一

注意:这里的$相当于python中的.
1. attach()函数

2. detach()函数
- detach并不会对数据框本身做任何处理,这句是可以省略的,写上是一个好的编程习惯

2.2.5 因子:factor()
- 连续型变量:可以呈现为某个范围内的任意值,并同时表示了顺序和数量
- 类别(名义型)变量和有序类别(有序型)变量在R中称为因子(factor)
- 函数factor()以一个整数向量的形式存储类别值,同时一个由字符串组成的内部向量将映射到这些整数上



2.2.6 列表:list()
格式:
mylist <- list(object1, object2)
# 你还可以对列表中的对象命名
mylist <- list(name1=object1, name2=object2)


2.3 数据的输入

2.3.1 使用键盘输入数据:edit()

