机器学习中的数学原理——多重回归算法

简介: 机器学习中的数学原理——多重回归算法

一、什么是多重回归

多重线性回归 (multiple linear regression) 是简单直线回归的推广,研究一个因变量与多个自变量之间的数量依存关系。多重线性回归用回归方程描述一个因变量与多个自变量的依存关系,简称 多重回归

二、案例分析

还记得我们之前研究最小二乘法的时候,是根据广告费来预测点击量的,广告费作为唯一变量。无论我们之后研究的梯度下降法还是多项式回归,都是建立在广告费作为唯一变量的前提下的。然而,实际情况中点击量是受到广告费在内的多个因素影响的。也就是说,以点击量作为因变量自变量会有多个。我们将原来的案例扩展一下,现在,决定点击量的除了广告费之外,还有广告的 展示位置和广告版面的大小等多个要素。设 广告费为 x1、广告栏的宽为 x2、广告栏的高为 x3,那么 fθ 可以 表示如下:

现在的问题就变成了怎么去求,按照我们之前的做法,只需要分别求出目标函数对偏微分,然后更新参数就可以了。但是在求偏微分之前,我们可以先试着简化表达式的写法。

想象一下,刚才我们说有 x1、x2、x3 共 3 个变量,下面我们把它推广到有 n个变量的情况。这时候 fθ 会变成什么样子呢?

每次都像这样写 n 个 x 岂不是很麻烦?所以我们现在还可以把参数 θ 和变量 x 看作向量

这里的1就相当于,这样的操作好处就在于保证了θ和 x 的维度相同,处理起来会容易很多。把 θ 转置之后,就可以计算一下它与 x 相乘的结果。

所以简化之后的表达式就变为:

接下来我们就使用 fθ(x)来求参数更新表达式吧,方法与之前一样。设 u = E(θ)、v = fθ(x)的部分是一样的。为了一般化,我们可以 考虑对第 j 个元素 θj 偏微分的表达式:

然后只需要求 v 对 θj 的微分就好了:

那么就可以得到第 j 个参数的更新表达式就是这样的:

这样我们就不用每个 θ 都写更新表达式,它们可以汇总为上面这样的一个表达式。像这样包含了多个变量的回归称为多重回归。可以基于一般化的思路来思考问题正是数学的优点。

三、总结

这一节主要学习了多重回归算法,有原来的一个自变量转化成了多个自变量,考虑多个自变量因变量的影响,从而确定最优参数。同时,我们还学习了简化表达式,将原来繁琐的多个表达式整理成一个通用的表达式,用到了向量的知识,注意和x相乘的时候需要进行转置,这一块在线性代数上面有提及。


相关文章
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
113 4
|
28天前
|
机器学习/深度学习 存储 运维
分布式机器学习系统:设计原理、优化策略与实践经验
本文详细探讨了分布式机器学习系统的发展现状与挑战,重点分析了数据并行、模型并行等核心训练范式,以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性,旨在提供一套全面的技术解决方案,以应对超大规模模型训练中的计算、存储及通信挑战。
64 4
|
2月前
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
50 1
|
2月前
|
机器学习/深度学习 自然语言处理 算法
深入理解机器学习算法:从线性回归到神经网络
深入理解机器学习算法:从线性回归到神经网络
|
2月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
105 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 算法
深入探索机器学习中的决策树算法
深入探索机器学习中的决策树算法
42 0
|
2月前
|
机器学习/深度学习 算法 Python
机器学习入门:理解并实现K-近邻算法
机器学习入门:理解并实现K-近邻算法
38 0
|
3月前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
2月前
|
机器学习/深度学习 自然语言处理 语音技术
探索机器学习中的深度学习模型:原理与应用
探索机器学习中的深度学习模型:原理与应用
46 0
|
3月前
|
机器学习/深度学习 算法 决策智能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能