全网最快入门———R语言机器学习实战篇2

简介: R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
+关注继续查看

R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

还是线性回归

项目实操——线性回归(二)

线性拟合常用函数:

image

使用predict()函数可以用拟合模型对新的数据集进行预测

直接使用plot()函数可以对拟合结果进行绘图:

plot(fit)

会生成四幅图:残差拟合图、正态分布qq图、大小位置图以及残差影响图

Abline()函数可以绘制出拟合曲线,但这个命令属于低级绘图命令,必须在高级绘图的基础上完成,我们先绘制身高与体重的散点图:

plot(women$height,women$weight)
> abline(fit)

最小二乘法的原理就是找到一条直线(拟合直线),使残差平方和最小

一般拟合曲线很少是直线,大部分都是曲线,也就是多项式的回归

还是women这个数据集,我们用多项式回归试一下:

先定义一个fit2变量

将体重作为因变量,身高与身高的平方作为自变量

fit2 <- lm(weight ~ height+I(height^2),data = women)

可以对比两次回归的曲线差异

plot(women$height,women$weight)
abline(fit)

这次使用lines()函数,这个函数能把点连成线,横坐标是身高数据,纵坐标是根据拟合模型的得出的预测值,为了增加比较的差异性,我们给第二个曲线增加颜色:

lines(women$height,fitted(fit2),col="red")

image

对比很明显,带有二次项的回归模型能够更好的拟合数据,使得更多的点落在曲线上

那么,三次项的回归模型效果是不是更好呢?我们再来拟合一下

fit3 <- lm(weight ~ height+I(height^2)+I(height^3),data=women)
plot(women$height,women$weight)
abline(fit)
> lines(women$height,fitted(fit2),col="red")
> lines(women$height,fitted(fit3),col="blue")

拟合结果如图:

image

结果表明,继续增加多项式可以提高拟合度,但是其实没有必要,因为用于拟合的数据集,只是用于建模的数据集,不一定适合真实的数据,过多的拟合也是纸上谈兵。

相关文章
|
2月前
|
机器学习/深度学习 并行计算 Go
探索Go语言在机器学习领域的应用局限与前景
探索Go语言在机器学习领域的应用局限与前景
21 1
BXA
|
7月前
|
机器学习/深度学习 人工智能 算法
C++与Python:哪种语言更适合机器学习
机器学习是一种人工智能的应用,它可以让计算机通过对大量数据的学习和分析,自动地寻找数据中的规律和模式,并且利用这些规律和模式进行预测和决策,从而达到人工智能的效果。机器学习技术在人脸识别、语音识别、推荐系统、自然语言处理等多个领域都有广泛的应用
BXA
171 0
|
7月前
|
机器学习/深度学习 JSON Rust
我为什么将机器学习主力语言从Python转到Rust
Rust语言诞生于2010年,一种多范式、系统级、高级通用编程语言,旨在提高性能和安全性,特别是无畏并发。虽然与Python相比,Rust还年轻,很多库还在开发中,但Rust社区非常活跃并且增长迅猛。很多大厂都是Rust基金会的成员,都在积极地用Rust重构底层基础设施和关键系统应用。
287 0
我为什么将机器学习主力语言从Python转到Rust
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇9《因子分析》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇9《因子分析》
|
机器学习/深度学习 数据采集 算法
全网最快入门———R语言机器学习实战篇8《主成分分析》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇8《主成分分析》
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇7《logistic回归》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇7《logistic回归》
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇6《广义线性模型》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇6《广义线性模型》
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇6《功效分析》
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
|
机器学习/深度学习 算法 数据可视化
全网最快入门———R语言机器学习实战篇5
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇5
|
机器学习/深度学习 算法 数据挖掘
全网最快入门———R语言机器学习实战篇4
R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
全网最快入门———R语言机器学习实战篇4
相关产品
机器翻译
推荐文章
更多