低门槛实战线性回归模型

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 本文是学习线性回归模型的总结,以图文相结合的方式,分享线性回归模型的技术原理,以及用代码实现验证,供大家参考。

本文是学习线性回归模型的总结,主要分享线性回归模型的技术原理,以及用代码实现验证,供大家参考。

一、任务描述

假设手上有一份数据集,每一行数据表示一个物品的价格影响因素(k个)和对应价格。

序号

影响因素1

影响因素2

影响因素k

价格(y)

1

1.23

3.23

1.56

7.23

2

0.23

1.60

2.56

8.33

...

...

...

...

...

1000

xx

xx

xx

xx

现在获得了该物品的k个影响因素,要求根据k个影响因素求取该物品的价格。

二、任务分析

1、目标

image.png

那么我们的任务就是寻找一组参数W和b,使得根据线性回归模型做出的价格预测尽可能接近数据里的真实价格。

2、评估

如何评估找到的一组参数W和b,就是使得根据线性回归模型做出的价格预测尽可能接近数据里的真实价格。

在深度学习中,损失函数(loss function)能够量化目标的实际值与预测值之间的差距。回归问题中最常用的损失函数是平方误差函数,那么第i个样本的损失为:

image.png

因此,在训练模型时,我们希望寻找一组参数(W,b),使得L(Wb在所有训练样本上的损失均值越小越好。

3、求解

在深度学习中,求解参数(W,b),一般用梯度下降法。梯度下降算法的步骤如下:

(1)初始化模型参数的值;(2)从数据集中随机抽取小批量样本且在负梯度的方向上更新参数,并不断迭代这一步骤,直到迭代次数达到设定阈值或损失小于某个阈值。

W和b的更新表达式如下:

image.png

批量大小和学习率的值通常是预先指定,而不是通过模型训练得到的这些可以调整但不在训练过程中更新的参数称为超参数(hyperparameter),所谓的调参就是选择超参数的过程。

三、代码验证

整个代码验证过程包括如下主要流程:

image.png

1、获取训练数据

为验证线性回归模型,我们定义一个线性函数,生成一个数据集。

image.png

为从n个样本数据中抽取小批量数据,定义个批量数据迭代器

image.png

2、定义模型

image.png

根据上述表达式定义线性回归模型。

image.png

3、定义损失函数

image.png

根据上述表达式定义损失函数。

image.png

4、定义优化算法

image.png

根据上述表达式定义优化算法。

image.png

5、初始化训练参数

首先初始化模型参数。

image.png

6、训练

image.png

训练结束后,可以查看W和b的参数,以及与真实值W和b的差异

image.png

运行结果

image.png

参考资料

1、《动手学深度学习》第二版,地址: zh.d2l.ai/index.html

目录
相关文章
|
6月前
|
机器学习/深度学习 算法 Python
CatBoost中级教程:集成学习与模型融合
CatBoost中级教程:集成学习与模型融合【2月更文挑战第13天】
170 3
|
机器学习/深度学习 资源调度 算法
【机器学习基础】多元线性回归(适合初学者的保姆级文章)
【机器学习基础】多元线性回归(适合初学者的保姆级文章)
416 0
|
3月前
|
机器学习/深度学习
机器学习回归模型相关重要知识点总结
机器学习回归模型相关重要知识点总结
|
4月前
|
机器学习/深度学习 数据可视化 TensorFlow
探索机器学习模型的可视化:从理论到实践
【7月更文挑战第31天】本文将深入探讨如何通过可视化技术来理解和解释复杂的机器学习模型。我们将介绍多种可视化工具和方法,并通过实际代码示例展示如何应用这些技术来揭示模型的内部工作原理。文章旨在为读者提供一种直观的方式来理解、调试和优化他们的机器学习模型。
43 0
|
5月前
|
机器学习/深度学习 数据采集 资源调度
【机器学习】逻辑回归:原理、应用与实践
逻辑回归(Logistic Regression)是一种广泛应用于分类问题的统计学方法,尽管其名称中含有“回归”二字,但它实际上是一种用于解决二分类或多分类问题的线性模型。逻辑回归通过使用逻辑函数(通常为sigmoid函数)将线性模型的输出映射到概率空间,从而预测某个事件发生的概率。本文将深入探讨逻辑回归的理论基础、模型构建、损失函数、优化算法以及实际应用案例,并简要介绍其在机器学习领域的地位和局限性。
405 2
|
5月前
|
机器学习/深度学习 算法
技术经验解读:【机器学习】代价函数(costfunction)
技术经验解读:【机器学习】代价函数(costfunction)
|
6月前
|
机器学习/深度学习 算法 数据可视化
如何选择正确的机器学习模型?
【5月更文挑战第4天】如何选择正确的机器学习模型?
116 4
|
6月前
|
机器学习/深度学习
机器学习基础入门(二)(线性回归与成本函数)
已知一系列房子的大小以及其对应的价格的数据,要求是已知房子大小预测其房子的价格
|
机器学习/深度学习 算法
【机器学习基础】一元线性回归(适合初学者的保姆级文章)
【机器学习基础】一元线性回归(适合初学者的保姆级文章)
116 0
|
机器学习/深度学习 算法 数据可视化
机器学习面试笔试之特征工程、优化方法、降维、模型评估2
机器学习面试笔试之特征工程、优化方法、降维、模型评估
116 0

热门文章

最新文章