【RL数学基础】微积分的基本概念:导数、偏导数、方向导数、梯度

简介: 【RL数学基础】微积分的基本概念:导数、偏导数、方向导数、梯度

1.导数

导数定义: 反应的是函数 y = f ( x ) y=f(x)y=f(x) 在某一点处沿着自变量 x xx 的正方向(即: x xx 轴正方向)的变化率。


导数公式:


image.png

image.png

b937c8a55d32771cda5567e72b3a400c_7c289fea345543afbd47782a3b7417f8.png



2.偏导数

偏导数定义: 以二元函数为例,反应的是函数 z = f ( x , y ) z=f(x,y)z=f(x,y) 在某一点处沿着某个坐标轴正方向(即:沿着 x xx 轴正方向或者沿着 y yy 轴正方向)的变化率。


偏导数公式:


image.png



注: 导数与偏导数本质是⼀致的,都是当⾃变量的变化趋于0时,函数值的变化与⾃变量的变化,它们两者之间⽐值的极限。


3.方向导数

在前⾯导数和偏导数的定义中,均是沿坐标轴正⽅向讨论函数的变化率。那么当我们讨论函数沿任意⽅向的变化率时,也就引出了⽅向导数的定义。


方向导数: 反应的是函数 y yy 在某一点 x 0 x_0x

0

 处沿着特定方向(不一定是 x xx 轴正方向了)的变化率。


4.梯度

梯度的提出只为了回答一个问题:函数在变量空间的某一点处,沿着哪个方向有最大的变化率?

梯度的定义如下:函数在某一点的梯度是这样的一个向量,它的方向与最大方向导数的方向一致,而它的大小为方向导数的最大值。


注意:

1)梯度是一个向量,即有方向有大小;

2)梯度的方向就是最大方向导数的方向,即:函数增长最快的方向。

3)梯度的值,就是最大方向导数的值。


区别: 偏导数只能对坐标轴某一方向求导数,方向倒数可以对自变量定义域内任意方向求导,而梯度是方向方向导数值取最大的一个特殊情况。


目录
相关文章
|
数据采集 机器学习/深度学习 搜索推荐
大模型开发: 描述主成分分析(PCA)以及它在降维中的应用。
PCA是广泛应用的降维技术,通过线性变换找到最大化方差的主成分,降低数据维度,简化计算并揭示数据结构。步骤包括数据预处理、计算协方差矩阵、特征值分解、选择主成分和数据转换。适用于图像识别、推荐系统等领域,但无监督性质可能导致类别信息丢失,且假设数据服从高斯分布。
330 1
|
Linux Python
如何更新pip源
如何更新pip源
|
6月前
|
SQL 大数据 数据挖掘
玩转大数据:从零开始掌握SQL查询基础
玩转大数据:从零开始掌握SQL查询基础
264 35
|
Web App开发 人工智能
阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪
阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪
4296 3
阿里放大招了!“通义听悟”确实有点新意了,为国产AI大模型打响应用第一枪
|
5月前
|
存储 安全 Java
Spring Security 入门与详解
Spring Security 是 Spring 框架中的核心安全模块,提供认证、授权及防护功能。本文详解其核心概念,包括认证(Authentication)、授权(Authorization)和过滤器链(Security Filter Chain)。同时,通过代码示例介绍基本配置,如 PasswordEncoder、UserDetailsService 和自定义登录页面等。最后总结常见问题与解决方法,助你快速掌握 Spring Security 的使用与优化。
1330 0
|
10月前
|
机器学习/深度学习 自然语言处理 知识图谱
预训练模型(Pre-trained Models)
预训练模型是在大量文本数据上训练的模型,能捕捉语言的通用特征,通过微调适用于各种NLP任务。它们具备迁移学习能力,减少训练时间和资源需求,支持多任务学习,但需注意模型偏见和可解释性问题。常见模型有BERT、GPT等,广泛应用于文本分类、情感分析等领域。
977 2
|
分布式计算 数据挖掘 云计算
CCF推荐C类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
中国计算机学会(CCF)在计算机体系结构、并行与分布计算、存储系统领域推荐了一系列C类会议和期刊。此汇总涵盖了各期刊和会议的全称、出版社、dblp文献网址及研究领域,为学者和研究人员提供了重要的学术交流资源。列表包括《ACM Journal on Emerging Technologies in Computing Systems》、《Concurrency and Computation: Practice and Experience》等期刊,以及ISPA、CCGRID等会议。这些资源对推动领域内的学术交流和技术进步具有重要意义。
CCF推荐C类会议和期刊总结:(计算机体系结构/并行与分布计算/存储系统领域)
|
机器学习/深度学习 计算机视觉
CNN全连接层是什么东东?
CNN全连接层是什么东东?
525 4
|
人工智能 自然语言处理 搜索推荐
《AIGC+软件开发新范式》--02.谈谈我对 AIGC 趋势下软件工程重塑的理解(2)
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
297 0
|
人工智能 自然语言处理 搜索推荐
《AIGC+软件开发新范式》--02.谈谈我对 AIGC 趋势下软件工程重塑的理解(3)
在AI 热度持续上升的当下,阿里云推出AI智能编码助手—通义灵码。通义灵码是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代数据集和编程教科书训练,为开发者带来高效、流畅的编码体验。
420 0