深度学习入门01-数学概念介绍-阿里云开发者社区

开发者社区> Java技术进阶> 正文

深度学习入门01-数学概念介绍

简介:

向量

向量是由n个实数组成的一个n行1列(n1)或一个1行n列(1n)的有序数组;
a=[1,2,3,4]
b=[6,7,8,9]


(x,y)表示二维空间(即面)上面的一个点;
(x,y,z)表示三维空间中的一个点
x 1,x 2,x 3.。。x n 表示n维空间一个具体的点


image.png


image.png


点乘

点乘也叫 点积


对于向量a和向量b:
image.png


image.png
a和b的点积公式为
image.png

余弦定理

sin cos

1、sin 30= 1/2
image.png
c 是斜边
c=a*2  --> a/c=0.5=sin 30


2、sin 45=根号2/2
image.png
a==b --> a/c=根号2/2
3、sin 60= 根号3/2
image.png


image.png




image.png


切线的斜率

斜率就是该点的切线,坐标y/x的值
比如下面的曲线(y=x)的斜率就是1
image.png


image.png
image.png


image.png

导数

image.png
导数 f ′ (x) 代表 f(x) 在点 x 处的斜率。换句话说,它表明如何缩放输入的小变化才能在输出获得相应的变化:f(x + ϵ) ≈ f(x) + ϵf ′ (x)。
说白了,就是衡量 x 变化时,y 变化的方向和快慢(不是速度,而是加速度)


例如 函数 y=f(x)=3x+1
x 增加2,y 增加6,
x 增加3,y 增加9,
x 增加4,y 增加12,
....。。。
那么 y 增加的速度就是恒定的,是3(9-6)
实际上,y=f(x)=3x+1的 导数 f ′ (x) 就是3
此时,随着变量 x的变化,y的变化方向和快慢是固定的,是常量


f(x + ϵ) ≈ f(x) + ϵf ′ (x)
f(x + ϵ) =x3+1+ϵ3,






基本初等函数的导数公式
image.png


log 和 ln

ln x,表示e的多少次方等于x
e是常量,值为:image.png
2.718
image.png
表示 e的2.9957次方等于20
image.png






logx y 表示x的多少次方等于y
image.png


image.png


根号

根号x   表示 什么数的平方等于x
image.png


image.png
image.png


拟合


image.png


目标/损失函数

针对任何模型求解问题,都是最终都是可以得到一组预测值y^ ,对比已有的真实值 y ,数据行数为 n ,可以将损失函数定义如下:

即预测值与真实值之间的平均的平方距离,统计中一般称其为MAE(mean square error)均方误差。把之前的函数式代入损失函数,并且将需要求解的参数w和b看做是函数L的自变量,可得



注意  image.png表示预测值

梯度下降

参考 https://www.yuque.com/whuanghkl/bbxlpq/dfkpin#YwmMs
导数有什么用呢?
通过导数,可以预测f(x)变化的趋势,如果 导数<0,表示f(x) 随着x的变化在变小,
如果 导数>0,表示f(x) 随着x的变化在变大,
因此导数对于最小化一个函数很有用,因为它告诉我们如何更改 x 来略微地改 善 y。例如,我们知道对于足够小的 ϵ 来说,f(x − ϵsign(f ′ (x))) 是比 f(x) 小的。因 此我们可以将 x 往导数的反方向移动一小步来减小 f(x)。这种技术被称为 梯度下降 (gradient descent)(Cauchy, 1847)。图 4.1 展示了一个例子。


image.png


image.png






数学工具,数学软件

image.png


符号说明

https://www.yuque.com/whuanghkl/bbxlpq/untwaa#9GZct


版权声明:本文首发在云栖社区,遵循云栖社区版权声明:本文内容由互联网用户自发贡献,版权归用户作者所有,云栖社区不为本文内容承担相关法律责任。云栖社区已升级为阿里云开发者社区。如果您发现本文中有涉嫌抄袭的内容,欢迎发送邮件至:developer2020@service.aliyun.com 进行举报,并提供相关证据,一经查实,阿里云开发者社区将协助删除涉嫌侵权内容。

分享:
Java技术进阶
使用钉钉扫一扫加入圈子
+ 订阅

Java技术进阶成长,课程资料,案例解析,实战经验全都有!

官网链接