备案控制台

开发者社区人工智能文章正文

线性回归（Linear regression）算法

2023-01-15 312

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 属于有监督学习、判别模型、有预测函数、有优化目标，有优化求解算法

归类：属于有监督学习、判别模型、有预测函数、有优化目标，有优化求解算法

应用：股票价格预测（依据过去的数据预测将来的状态）

分类：

回归按照输入变量的个数可分为：一元回归和多元回归

按照输入变量和输出变量的关系可分为：线性回归和非线性回归

回归可称为函数的拟合：选择一条函数曲线能很好的拟合过去的数据并且能够预测将来的数据

回归：用观察使认知接近真值的过程，回归本源。参考：各种回归都是什么意思http://blog.sina.com.cn/s/blog_7445c2940102wln5.html

一、线性回归（Linear regression）

利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。

其中的最小二乘法（又称最小平方法）是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。来自维基百科最小二乘

线性回归的适用情况

(1)线性 Linearity

因变量和每个自变量都是线性关系。

(2)独立性Indpendence

对于所有的观测值，它们的误差项相互之间是独立的。

(3) 正态性Normality

误差项服从正态分布。（通过正态分布可以导出损失函数表达式）

(4)等方差Equal-variance

所有的误差项具有同样方差。

基本原理及公式推导：

输入数据 X（特征数），输出数据Y，参数

给定一个数据集（X,Y）,尽可能的学得一个线性模型h( )对新的数据xi预测出f(xi),使得h (xi)尽可能的逼近真实值yi。

引入损失函数（均方误差）

其中损失函数，也即是描述不好的程度。也就是损失函数越小则越逼近真实值。也可称这个函数为J函数

具体过程为：

模型表示：

向量形式表示：

损失函数：

通过求解损失函数（均方误差）最小求得参数的过程。

其中参数的求解方法有两种：最小二乘和梯度下降还有一种是正则化项

1.考虑x为单个特征情况：

x只有一个特征变量。

（1）引入均方误差度量方式，也即是相当于平方损失

基于上述的均方误差最小求解模型的方法也称为最小二乘法。（西瓜书解释）

2）求偏导

3）令偏导为零获得闭式解

考虑x为多个特征情况（也称为多元回归）

表示为矩阵形式：

构造损失函数：

求导：

分两种情况：矩阵 X满秩和不满秩

满秩矩阵相当于正定矩阵，也就是在求解线性方程组的时候，方程组的个数和要求解的变量个数一样，这个时候是满秩的，则能够得到唯一解，满秩矩阵是可逆的，行列式不为零，也是非奇异矩阵。

（1）矩阵 X满秩情况

求导为零

（2）不满秩的情况

要求解的变量个数大于样本数，求得多个解wi，它们都能使得均方误差最小，那么问题是选择哪一个作为解作为输出？

第一种：引入正则化项（相当于对不重要的变量去掉，使它能够满足线性方程组的解唯一情况）

参考：https://blog.csdn.net/gshgsh1228/article/details/52199870

0ccdd0deff3041667e91165b69fceb06_watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2hlZGEz,size_16,color_FFFFFF,t_70.png

（后续待进一步理解）

第二种、采用梯度下降算法求解

（2.1）设置初始值可以是随机的

（2.2）改变θ的值，使得J(θ)按梯度下降的方向进行减少

参考：

【1】从零开始机器学习001-线性回归数学推导 http://blog.51cto.com/12133258/2051527

【2】线性回归详解https://blog.csdn.net/qq_36330643/article/details/77649896 参考的斯坦福课程视频

【3】机器学习入门的绝佳材料：斯坦福大学机器学习课程原始讲义(含公开课视频)https://blog.csdn.net/datoubo/article/details/8597996

【4】统计学习

【5】西瓜书

文章标签：

机器学习/深度学习

算法

关键词：

算法线性回归

线性回归算法

regression算法

算法regression

linear算法

heda3

目录

相关文章

花开花落的世界

|

3月前

|

机器学习/深度学习自然语言处理算法

深入理解机器学习算法：从线性回归到神经网络

深入理解机器学习算法：从线性回归到神经网络

花开花落的世界

102 2 2

东方睿赢

|

5月前

|

存储算法测试技术

预见未来？Python线性回归算法：数据中的秘密预言家

【9月更文挑战第11天】在数据的海洋中，线性回归算法犹如智慧的预言家，助我们揭示未知。本案例通过收集房屋面积、距市中心距离等数据，利用Python的pandas和scikit-learn库构建房价预测模型。经过训练与测试，模型展现出较好的预测能力，均方根误差（RMSE）低，帮助房地产投资者做出更明智决策。尽管现实关系复杂多变，线性回归仍提供了有效工具，引领我们在数据世界中自信前行。

东方睿赢

71 5 5

AI之家

|

6月前

|

机器学习/深度学习人工智能算法

【人工智能】线性回归模型：数据结构、算法详解与人工智能应用，附代码实现

线性回归是一种预测性建模技术，它研究的是因变量（目标）和自变量（特征）之间的关系。这种关系可以表示为一个线性方程，其中因变量是自变量的线性组合。

AI之家

118 2 2

BetterBench

|

6月前

|

机器学习/深度学习算法测试技术

【博士每天一篇文献-算法】A Simple Way to Initialize Recurrent Networks of Rectified Linear Units

本文介绍了一种新的递归神经网络（RNN）初始化方法，通过使用单位矩阵或其缩放版本来初始化修正线性单元（ReLU）组成的RNN，称为IRNN，该方法在处理长期依赖任务时表现优异，与长短期记忆（LSTM）RNN性能相当。

BetterBench

50 1 1

东方睿赢

|

6月前

|

存储算法定位技术

预见未来？Python线性回归算法：数据中的秘密预言家

【8月更文挑战第3天】站在数据的海洋边，线性回归算法犹如智慧的预言家，揭示着房价的秘密。作为房地产投资者，面对复杂的市场，我们可通过收集房屋面积、位置等数据并利用Python的pandas及scikit-learn库，建立线性回归模型预测房价。通过评估模型的均方根误差(RMSE)，我们可以更精准地判断投资时机，让数据引领我们走向成功的彼岸。

东方睿赢

37 1 1

土木林森

|

6月前

|

机器学习/深度学习算法数据可视化

Python数据分析高手修炼手册：线性回归算法，让你的数据说话更有力

【8月更文挑战第1天】在数据驱动时代,掌握数据分析技能至关重要。线性回归是最基础且强大的工具之一,能从复杂数据中提炼简单有效的模型。本文探索Python中线性回归的应用并通过实战示例加深理解。线性回归建立变量间线性关系模型:Y = β0 + β1*X + ε。使用scikit-learn库进行实战:首先安装必要库,然后加载数据、训练模型并评估性能。示例展示了如何使用`LinearRegression`模型进行房价预测,包括数据可视化。掌握线性回归,让数据“说话”更有力。

土木林森

56 2 2

算法金

|

7月前

|

机器学习/深度学习人工智能算法

算法金 | 线性回归：不能忽视的五个问题

**线性回归理论基于最小二乘法和特定假设，如线性关系、同方差性等。多重共线性指自变量间高度相关，影响模型稳定性及系数解释。自相关性是观测值间的关联，违反独立性假设，影响模型预测。异方差性是误差项方差随自变量变化，导致参数估计失真。训练数据与测试数据分布不一致会降低模型泛化能力。检测和处理这些问题涉及VIF、自相关图、变换、加权最小二乘法等方法。**

算法金

86 1 1

算法金 | 线性回归：不能忽视的五个问题

aliyun0925406400-41188

|

7月前

|

数据采集机器学习/深度学习算法

Python实现多元线性回归模型(statsmodels OLS算法)项目实战

Python实现多元线性回归模型(statsmodels OLS算法)项目实战

aliyun0925406400-41188

1150 2 2

AIGC小王子

|

7月前

|

数据采集机器学习/深度学习算法

「AIGC算法」线性回归模型

线性回归是监督学习经典算法，用于预测连续值。分为简单线性（1个特征）和多元线性（多特征）两种。模型建立涉及数据预处理、特征选择、参数估计和损失函数最小化。Python中可使用`sklearn`库快速实现，例如，创建、训练模型，预测并可视化结果。广泛应用于多个领域。

AIGC小王子

62 0 0

百锦再@新空间代码工作室

|

7月前

|

机器学习/深度学习人工智能供应链

AI算法：机器学习之线性回归

AI算法：机器学习之线性回归

百锦再@新空间代码工作室

134 0 0

热门文章

最新文章

图解前向、反向传播算法，一看就懂！

利用SVM(支持向量机)分类算法对鸢尾花数据集进行分类

通过算法备案之后就万事大吉了么？

算法备案全流程攻略：保姆级教程

C 408—《数据结构》算法题基础篇—链表（下）

使用贪心算法解决最小生成树问题

C 408—《数据结构》算法题基础篇—链表（上）

Transformer打破三十年数学猜想！Meta研究者用AI给出反例，算法杀手攻克数学难题

【算法合规新时代】企业如何把握“清朗·网络平台算法典型问题治理”专项行动？

Java线程调度揭秘：从算法到策略，让你面试稳赢！

基于FPGA的图像双线性插值算法verilog实现,包括tb测试文件和MATLAB辅助验证

基于电导增量MPPT控制算法的光伏发电系统simulink建模与仿真

探秘员工泄密行为防线：基于Go语言的布隆过滤器算法解析

基于GWO灰狼优化的CNN-GRU-SAM网络时间序列回归预测算法matlab仿真

基于粒子群算法的网络最优节点部署优化matlab仿真

近端策略优化(PPO)算法的理论基础与PyTorch代码详解

扩散模型=进化算法！生物学大佬用数学揭示本质

内网桌面监控软件深度解析：基于 Python 实现的 K-Means 算法研究

为什么自己写的算法备案文档越改问题越多？

解锁文件共享软件背后基于 Python 的二叉搜索树算法密码

相关课程

更多

智能运维赛（复赛）：利用数据和算法，快速定位系统异常并进行根因分析

智能创作赛（复赛）：相册应用中的视频故事生成算法介绍

智能创作赛（初赛）：相册应用中的故事生成算法介绍

相册服务中的故事生成算法介绍

Go语言核心编程 - 数据结构和算法

神经网络概览及算法详解

相关电子书

更多

数据+算法定义新世界

袋鼠云基于实时计算的反黄牛算法

Alink：基于Apache Flink的算法平台

相关实验场景

更多

使用Swing算法实现商品推荐

RSA密码算法设计与实现

RSA非对称加密算法

欧拉图的构造性证明与算法实现

推荐系统入门之使用ALS算法实现打分预测

下一篇

PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型