机器学习中的数学原理——多重回归算法

简介: 机器学习中的数学原理——多重回归算法

一、什么是多重回归

多重线性回归 (multiple linear regression) 是简单直线回归的推广,研究一个因变量与多个自变量之间的数量依存关系。多重线性回归用回归方程描述一个因变量与多个自变量的依存关系,简称 多重回归

二、案例分析

还记得我们之前研究最小二乘法的时候,是根据广告费来预测点击量的,广告费作为唯一变量。无论我们之后研究的梯度下降法还是多项式回归,都是建立在广告费作为唯一变量的前提下的。然而,实际情况中点击量是受到广告费在内的多个因素影响的。也就是说,以点击量作为因变量自变量会有多个。我们将原来的案例扩展一下,现在,决定点击量的除了广告费之外,还有广告的 展示位置和广告版面的大小等多个要素。设 广告费为 x1、广告栏的宽为 x2、广告栏的高为 x3,那么 fθ 可以 表示如下:

现在的问题就变成了怎么去求,按照我们之前的做法,只需要分别求出目标函数对偏微分,然后更新参数就可以了。但是在求偏微分之前,我们可以先试着简化表达式的写法。

想象一下,刚才我们说有 x1、x2、x3 共 3 个变量,下面我们把它推广到有 n个变量的情况。这时候 fθ 会变成什么样子呢?

每次都像这样写 n 个 x 岂不是很麻烦?所以我们现在还可以把参数 θ 和变量 x 看作向量

这里的1就相当于,这样的操作好处就在于保证了θ和 x 的维度相同,处理起来会容易很多。把 θ 转置之后,就可以计算一下它与 x 相乘的结果。

所以简化之后的表达式就变为:

接下来我们就使用 fθ(x)来求参数更新表达式吧,方法与之前一样。设 u = E(θ)、v = fθ(x)的部分是一样的。为了一般化,我们可以 考虑对第 j 个元素 θj 偏微分的表达式:

然后只需要求 v 对 θj 的微分就好了:

那么就可以得到第 j 个参数的更新表达式就是这样的:

这样我们就不用每个 θ 都写更新表达式,它们可以汇总为上面这样的一个表达式。像这样包含了多个变量的回归称为多重回归。可以基于一般化的思路来思考问题正是数学的优点。

三、总结

这一节主要学习了多重回归算法,有原来的一个自变量转化成了多个自变量,考虑多个自变量因变量的影响,从而确定最优参数。同时,我们还学习了简化表达式,将原来繁琐的多个表达式整理成一个通用的表达式,用到了向量的知识,注意和x相乘的时候需要进行转置,这一块在线性代数上面有提及。


相关文章
|
1月前
|
存储 算法 Java
解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用
在Java中,Set接口以其独特的“无重复”特性脱颖而出。本文通过解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用。
44 3
|
1月前
|
机器学习/深度学习 算法 机器人
多代理强化学习综述:原理、算法与挑战
多代理强化学习是强化学习的一个子领域,专注于研究在共享环境中共存的多个学习代理的行为。每个代理都受其个体奖励驱动,采取行动以推进自身利益;在某些环境中,这些利益可能与其他代理的利益相冲突,从而产生复杂的群体动态。
190 5
|
16天前
|
算法 容器
令牌桶算法原理及实现,图文详解
本文介绍令牌桶算法,一种常用的限流策略,通过恒定速率放入令牌,控制高并发场景下的流量,确保系统稳定运行。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
令牌桶算法原理及实现,图文详解
|
25天前
|
负载均衡 算法 应用服务中间件
5大负载均衡算法及原理,图解易懂!
本文详细介绍负载均衡的5大核心算法:轮询、加权轮询、随机、最少连接和源地址散列,帮助你深入理解分布式架构中的关键技术。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
5大负载均衡算法及原理,图解易懂!
|
12天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
44 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
1月前
|
算法 数据库 索引
HyperLogLog算法的原理是什么
【10月更文挑战第19天】HyperLogLog算法的原理是什么
53 1
|
1月前
|
机器学习/深度学习 算法 Java
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
机器学习、基础算法、python常见面试题必知必答系列大全:(面试问题持续更新)
|
1月前
|
机器学习/深度学习 人工智能 算法
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
81 0
[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解
|
1月前
|
机器学习/深度学习 人工智能 算法
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
玉米病害识别系统,本系统使用Python作为主要开发语言,通过收集了8种常见的玉米叶部病害图片数据集('矮花叶病', '健康', '灰斑病一般', '灰斑病严重', '锈病一般', '锈病严重', '叶斑病一般', '叶斑病严重'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。再使用Django搭建Web网页操作平台,实现用户上传一张玉米病害图片识别其名称。
60 0
【玉米病害识别】Python+卷积神经网络算法+人工智能+深度学习+计算机课设项目+TensorFlow+模型训练
下一篇
无影云桌面