R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
下面对R语言中函数解释
函数介绍——R语言中的函数
使用lm()函数进行回归分析,例如研究state.x77这个数据,研究犯罪率与其他指标的关系:
首先将数据转化为数据框,因为lm()函数只能对数据框进行操作
state<-as.data.frame(state.x77[,c('Murder','Population','Illiteracy','Income','Frost')])
再使用lm()函数进行回归分析,研究人口、文盲率、收入以及天气对犯罪率的影响:
fit<-lm(Murder~Population+Illiteracy+Income+Frost,data=state)
使用summary()得出统计结果
summary(fit)
后面的*代表数据的显著性,数据中,文盲率的回归系数是4.14,表示其他数据不变时,文盲率上升1%,则犯罪率上升4.14%,且回归系数在p<0.001的情况下,显著不为0,也就是显著。而如果数据不显著,则说明两者没有直接关系。
R函数的返回值:
ls()返回当前环境中的对象,也就是有多少变量
sys.date()返回当前系统时间
rm()删除指定的变量,但是这个函数是直接删除,不会有返回
使用函数要注意输入数据的格式
可以使用help()函数查看每个函数的帮助文档
函数介绍——函数的选项参数
一般函数的选项参数可以分成三个部分:输入控制部分;输出控制部分;调节部分
输入控制部分负责告诉用户函数能接受哪种类型的数据,这个选项参数往往出现在函数的第一位,比如说,有些函数的第一位选项参数是“file”说明使用这个函数你需要输入一个文件;如果是“data”则是需要输入一个数据框;“x”代表单独的一个对象,一般都是向量,也可以是矩阵或者列表;“x和y”代表函数需要两个输入变量;“x、y、z”函数需要三个输入变量;“formula”输入的是公式;(具体查看每个函数的帮助文档)
输出控制部分
调节参数:
选项接受哪些参数: