深度学习入门01-数学概念介绍

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
简介: 本文首先介绍了向量的概念及其表示方法,随后详细解释了向量间的点乘运算及计算公式。接着通过几个典型角度展示了正弦(sin)值的计算方法,并简要提及了余弦定理。文章进一步探讨了切线斜率的概念,将其定义为曲线上某点y/x的值,并举例说明。导数部分解释了导数作为函数在某点斜率的意义,以及它是如何衡量输入变化引起输出变化的方向与速率的。此外,还讨论了基本初等函数的导数公式。对数(log)和自然对数(ln)的概念被引入,包括它们的定义及计算方式。接着,文章解释了根号表示的意义,即寻找哪个数的平方等于给定数值。

向量

向量是由n个实数组成的一个n行1列(n1)或一个1行n列(1n)的有序数组;
a=[1,2,3,4]
b=[6,7,8,9]


(x,y)表示二维空间(即面)上面的一个点;
(x,y,z)表示三维空间中的一个点
x 1,x 2,x 3.。。x n 表示n维空间一个具体的点


image.png


image.png


点乘

点乘也叫 点积


对于向量a和向量b:
image.png


image.png
a和b的点积公式为
image.png

余弦定理

sin cos

1、sin 30= 1/2
image.png
c 是斜边
c=a*2 --> a/c=0.5=sin 30


2、sin 45=根号2/2
image.png
a==b --> a/c=根号2/2
3、sin 60= 根号3/2
image.png


image.png




image.png


切线的斜率

斜率就是该点的切线,坐标y/x的值
比如下面的曲线(y=x)的斜率就是1
image.png


image.png
image.png


image.png

导数

image.png
导数 f ′ (x) 代表 f(x) 在点 x 处的斜率。换句话说,它表明如何缩放输入的小变化才能在输出获得相应的变化:f(x + ϵ) ≈ f(x) + ϵf ′ (x)。
说白了,就是衡量 x 变化时,y 变化的方向和快慢(不是速度,而是加速度)


例如 函数 y=f(x)=3x+1
x 增加2,y 增加6,
x 增加3,y 增加9,
x 增加4,y 增加12,
....。。。
那么 y 增加的速度就是恒定的,是3(9-6)
实际上,y=f(x)=3x+1的 导数 f ′ (x) 就是3
此时,随着变量 x的变化,y的变化方向和快慢是固定的,是常量


f(x + ϵ) ≈ f(x) + ϵf ′ (x)
f(x + ϵ) =x*3+1+ϵ*3,






基本初等函数的导数公式
image.png


log 和 ln

ln x,表示e的多少次方等于x
e是常量,值为:image.png
2.718
image.png
表示 e的2.9957次方等于20
image.png






logx y 表示x的多少次方等于y
image.png


image.png


根号

根号x 表示 什么数的平方等于x
image.png


image.png
image.png


拟合


image.png


目标/损失函数

针对任何模型求解问题,都是最终都是可以得到一组预测值y^ ,对比已有的真实值 y ,数据行数为 n ,可以将损失函数定义如下:

即预测值与真实值之间的平均的平方距离,统计中一般称其为MAE(mean square error)均方误差。把之前的函数式代入损失函数,并且将需要求解的参数w和b看做是函数L的自变量,可得



注意 image.png表示预测值

梯度下降

参考 https://www.yuque.com/whuanghkl/bbxlpq/dfkpin#YwmMs
导数有什么用呢?
通过导数,可以预测f(x)变化的趋势,如果 导数<0,表示f(x) 随着x的变化在变小,
如果 导数>0,表示f(x) 随着x的变化在变大,
因此导数对于最小化一个函数很有用,因为它告诉我们如何更改 x 来略微地改 善 y。例如,我们知道对于足够小的 ϵ 来说,f(x − ϵsign(f ′ (x))) 是比 f(x) 小的。因 此我们可以将 x 往导数的反方向移动一小步来减小 f(x)。这种技术被称为 梯度下降 (gradient descent)(Cauchy, 1847)。图 4.1 展示了一个例子。


image.png


image.png






数学工具,数学软件

image.png


符号说明

https://www.yuque.com/whuanghkl/bbxlpq/untwaa#9GZct


符号说明

image.png


image.png


我们通常使用一个上标 ∗ 表示最小化或最大化函数时的 x 值。如我们记 x ∗ = arg min f(x)。

image.png

** :多次方
:= 表示赋值操作

相关文章
|
4天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
2月前
|
机器学习/深度学习 人工智能 算法
深度学习入门:理解神经网络与反向传播算法
【9月更文挑战第20天】本文将深入浅出地介绍深度学习中的基石—神经网络,以及背后的魔法—反向传播算法。我们将通过直观的例子和简单的数学公式,带你领略这一技术的魅力。无论你是编程新手,还是有一定基础的开发者,这篇文章都将为你打开深度学习的大门,让你对神经网络的工作原理有一个清晰的认识。
|
1月前
|
机器学习/深度学习 数据采集 自然语言处理
通过深度学习实践来理解深度学习的核心概念
通过实践,不仅可以加深对深度学习概念的理解,还能发现理论与实际之间的差距,进而对模型进行改进和优化。实践中遇到的问题(如梯度消失、过拟合、训练效率低等)能促使你深入思考,进而更加全面地掌握深度学习的核心概念。
44 4
|
1月前
|
机器学习/深度学习 PyTorch 算法框架/工具
深度学习入门案例:运用神经网络实现价格分类
深度学习入门案例:运用神经网络实现价格分类
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
软件工程师,入门下深度学习吧
软件工程师,入门下深度学习吧
56 9
|
2月前
|
机器学习/深度学习 分布式计算 数据可视化
对深度学习概念的基础理解与认识
一、神经网络的组成 人工神经网络(Artificial Neural Networks,简写为ANNs)是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。 这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的,并具有自学习和自适应的能力。神经网络类型众多,其中最为重要的是多层感知机。为了详细地描述神经网络,我们先从最简单的神经网络说起。 感知机 感知机是1957年,由Rosenblatt提出会,是神经网络和支持向量机的基础。 感知机是有生物学上的一个启发,他的参照对象和理论依据可以参照下图:(我们的大脑可以认为是一个神经网络,
对深度学习概念的基础理解与认识
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN)入门与实践
【8月更文挑战第62天】本文以浅显易懂的方式介绍了深度学习领域中的核心技术之一——卷积神经网络(CNN)。文章通过生动的比喻和直观的图示,逐步揭示了CNN的工作原理和应用场景。同时,结合具体的代码示例,引导读者从零开始构建一个简单的CNN模型,实现对图像数据的分类任务。无论你是深度学习的初学者还是希望巩固理解的开发者,这篇文章都将为你打开一扇通往深度学习世界的大门。
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
深度学习入门:从理论到实践
【9月更文挑战第22天】本文将带你走进深度学习的世界,从基础的理论概念出发,逐步深入到实践应用。我们将探讨神经网络的工作原理,以及如何通过编程实现一个简单的深度学习模型。无论你是初学者还是有一定基础的学习者,都能在这篇文章中找到有价值的信息。让我们一起揭开深度学习的神秘面纱,探索这个充满无限可能的领域吧!
|
2月前
|
机器学习/深度学习 人工智能 算法
深度学习中的卷积神经网络(CNN)入门与实践
【9月更文挑战第19天】在这篇文章中,我们将探索深度学习的一个重要分支——卷积神经网络(CNN)。从基础概念出发,逐步深入到CNN的工作原理和实际应用。文章旨在为初学者提供一个清晰的学习路径,并分享一些实用的编程技巧,帮助读者快速上手实践CNN项目。
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
深度学习入门:理解卷积神经网络(CNN)
【9月更文挑战第14天】本文旨在为初学者提供一个关于卷积神经网络(CNN)的直观理解,通过简单的语言和比喻来揭示这一深度学习模型如何识别图像。我们将一起探索CNN的基本组成,包括卷积层、激活函数、池化层和全连接层,并了解它们如何协同工作以实现图像分类任务。文章末尾将给出一个简单的代码示例,帮助读者更好地理解CNN的工作原理。
53 7