R语言:第一部分 入门

简介: R语言:第一部分 入门

第一章 R语言介绍


1.1 工作空间:workspcae


工作空间(workspace)就是当前R的工作环境,它存储着所有用户定义的对象(向量、矩阵、函数、数据库、数据框、列表)。在一个R会话结束时,你可以在当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。



例1:



1.2 输入和输出


1.2.1 输入


函数source(“filename”)可在当前会话中执行一个脚本。如果文件名中不包含路径,R将假设此脚本在当前工作目录中。


例:


source("myscript.R")  # 执行包含在文件myscript.R中的R语句集合


1.2.2 文本输出


函数sink(“filename”)可在当前会话中执行一个脚本。默认情况下,如果文件已经存在,则它的内容将被覆盖。


  • 使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它。


  • 参数split=TRUE可将输出同事发送到屏幕和输出文件中。


  • 不加参数调用命令sink()仅向屏幕返回输出结果。


1.2.3 图形输出


虽然sink()可以重定向文本输出,但它对图形输出没有影响。要重定向图形输出,使用一下函数。最后使用**dev.off()**将输出返回到终端



1.3 包


1.安装包


install.packages("需要安装的包名")


2.更新包


update.packages("需要更新的包名")


3.查看已安装包的描述


installed.packages("包名")


4.包的载入


要使用安装的包,需要先载入。


library(包名)   # 这里不需要引号,安装需要


第二章 创建数据集


2.1 数据集的概念


数据集通常是有数据构成的一个矩形数组,行表示观测,列表示变量。如下:



  • R中有许多用于存储数据的结构,包括标量、向量、数组、数据框和列表。


  • R可以处理的数据类型包括数值型、字符型、逻辑型(FALSE/TRUE)、复数型、和原生型(字节)。


2.2 数据结构


2.2.1 向量:c()


  • 向量是用于存储数值型、字符型或逻辑型数据的一维数组。


  • 执行组合功能的函数c()可用来创建向量。


例1:创建向量


> a <- c(1,2,3,4,5,-1)               # 数值类型
> b <- c("one", "two", "three")      # 字符型向量
> c <- c(TRUE, FALSE, TRUE, FALSE)   # 逻辑型向量


注意:单个向量只能是一种数据类型


例2:访问向量中的元素


> a <- c(1,2,3,4,5,-1)
> a[3]          # 第三个,索引从1开始,而不是0
[1] 3  
> a[c(1,3,6)]   # 第1,3,6个
[1]  1  3 -1
> a[2:6]        # 第2到6个
[1]  2  3  4  5 -1   


2.2.2 矩阵:matrix()


  • 矩阵是一个二维数组,只是每一个元素都拥有相同的模式(数值型、字符型或逻辑型)。


  • 可通过函数matrix创建矩阵


格式:


mymatrix <- matrix(vector, nrow=a, ncol=b, byrow=TRUE/FALSE, dimnames=list(r_name,c_name))


1.vector:包含了矩阵的元素


2.nrow:指定行数


3.ncol:指定列数


4.byrow:TRUE则按行填充;FALSE则按列填充;默认按列


5.dimnames:以字符向量表示行名和列名




2.2.3 数组:array()


  • 数组和矩阵类似,但是维度可以大于2。


  • 数组通过array()函数创建


形式:


myarray <- array(vector, dimensions, dimnames)


1.vector:包含了数组中的数据


2.dimensions:是一个数值型向量,给出了各个维度下标的最大值。(可选)


例:创建234的三维数组



2.2.4 数据框:data.frame()


  • 可包含不同模式(数值型、字符型)的数据


  • 可通过data.frame()创建


格式:


mydata <- data.frame(col1, col2, col3, ...)
• 1


1.列向量col1,col2,col3可为任何类型(如字符型、数值型或逻辑型)



注意:每一列的模式必须唯一



注意:这里的$相当于python中的.


1. attach()函数


  • 可将数据框添加到R的搜索路径中



2. detach()函数


  • 将数据框从搜索路径中移除


  • detach并不会对数据框本身做任何处理,这句是可以省略的,写上是一个好的编程习惯



2.2.5 因子:factor()


  • 变量可以归结为名义型、有序型、连续型变量。


  • 名义型变量:没有顺序之分的类别变量


  • 有序型变量:表示一种顺序关系,而非数量关系


  • 连续型变量:可以呈现为某个范围内的任意值,并同时表示了顺序和数量


  • 类别(名义型)变量和有序类别(有序型)变量在R中称为因子(factor)


  • 函数factor()以一个整数向量的形式存储类别值,同时一个由字符串组成的内部向量将映射到这些整数上





2.2.6 列表:list()


  • 一些对象的有序集合


  • 对象可以是任何结构


格式:


mylist <- list(object1, object2)
# 你还可以对列表中的对象命名
mylist <- list(name1=object1, name2=object2)




2.3 数据的输入



2.3.1 使用键盘输入数据:edit()




相关文章
|
机器学习/深度学习 数据采集 算法
全网最快入门———R语言机器学习实战篇8《主成分分析》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇8《主成分分析》
|
8月前
|
数据采集 机器学习/深度学习 人工智能
数据清洗、数据处理入门!R语言我来了,数据不再零散!
「数据清洗」和「预处理」是数据科学中必不可少的一部分,它们能够帮助我们准确地分析和预测未来趋势。如果你曾经尝试过进行分析或建模,你会发现数据往往不像我们所想象的那样干净、整洁。需要对数据进行仔细的检查、清理和处理,才能真正把数据转变成有用的信息。
265 0
|
11月前
|
数据可视化 数据挖掘 Python
生命科学相关专业入门R语言的参考资料推荐
生命科学相关专业入门R语言的参考资料推荐
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇9《因子分析》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇9《因子分析》
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇7《logistic回归》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇7《logistic回归》
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇6《广义线性模型》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇6《广义线性模型》
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇6《功效分析》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
|
机器学习/深度学习 算法 数据可视化
全网最快入门———R语言机器学习实战篇5
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇5
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇4
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇4
|
机器学习/深度学习 存储 算法
全网最快入门———R语言机器学习实战篇3
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇3

热门文章

最新文章