向量
向量是由n个实数组成的一个n行1列(n1)或一个1行n列(1n)的有序数组;
a=[1,2,3,4]
b=[6,7,8,9]
(x,y)表示二维空间(即面)上面的一个点;
(x,y,z)表示三维空间中的一个点
x 1,x 2,x 3.。。x n 表示n维空间一个具体的点
点乘
点乘也叫 点积
对于向量a和向量b:
a和b的点积公式为
余弦定理
sin cos
1、sin 30= 1/2
c 是斜边
c=a*2 --> a/c=0.5=sin 30
2、sin 45=根号2/2
a==b --> a/c=根号2/2
3、sin 60= 根号3/2
切线的斜率
斜率就是该点的切线,坐标y/x的值
比如下面的曲线(y=x)的斜率就是1
导数
导数 f ′ (x) 代表 f(x) 在点 x 处的斜率。换句话说,它表明如何缩放输入的小变化才能在输出获得相应的变化:f(x + ϵ) ≈ f(x) + ϵf ′ (x)。
说白了,就是衡量 x 变化时,y 变化的方向和快慢(不是速度,而是加速度)
例如 函数 y=f(x)=3x+1
x 增加2,y 增加6,
x 增加3,y 增加9,
x 增加4,y 增加12,
....。。。
那么 y 增加的速度就是恒定的,是3(9-6)
实际上,y=f(x)=3x+1的 导数 f ′ (x) 就是3
此时,随着变量 x的变化,y的变化方向和快慢是固定的,是常量
f(x + ϵ) ≈ f(x) + ϵf ′ (x)
f(x + ϵ) =x*3+1+ϵ*3,
基本初等函数的导数公式
log 和 ln
ln x,表示e的多少次方等于x
e是常量,值为:
2.718
表示 e的2.9957次方等于20
logx y 表示x的多少次方等于y
根号
根号x 表示 什么数的平方等于x
拟合
目标/损失函数
针对任何模型求解问题,都是最终都是可以得到一组预测值y^ ,对比已有的真实值 y ,数据行数为 n ,可以将损失函数定义如下:
即预测值与真实值之间的平均的平方距离,统计中一般称其为MAE(mean square error)均方误差。把之前的函数式代入损失函数,并且将需要求解的参数w和b看做是函数L的自变量,可得
注意 表示预测值
梯度下降
参考 https://www.yuque.com/whuanghkl/bbxlpq/dfkpin#YwmMs
导数有什么用呢?
通过导数,可以预测f(x)变化的趋势,如果 导数<0,表示f(x) 随着x的变化在变小,
如果 导数>0,表示f(x) 随着x的变化在变大,
因此导数对于最小化一个函数很有用,因为它告诉我们如何更改 x 来略微地改 善 y。例如,我们知道对于足够小的 ϵ 来说,f(x − ϵsign(f ′ (x))) 是比 f(x) 小的。因 此我们可以将 x 往导数的反方向移动一小步来减小 f(x)。这种技术被称为 梯度下降 (gradient descent)(Cauchy, 1847)。图 4.1 展示了一个例子。
数学工具,数学软件
符号说明
https://www.yuque.com/whuanghkl/bbxlpq/untwaa#9GZct
符号说明
我们通常使用一个上标 ∗ 表示最小化或最大化函数时的 x 值。如我们记 x ∗ = arg min f(x)。
** :多次方
:= 表示赋值操作