2 微积分
2.1 导数的定义
如果是一阶导数y=kx那么导数就是k,导数就是斜率
2.2 偏导数
2.3 方向导数
一个函数沿着指定方向的变化率
2.4 梯度
梯度就是方向取得导数的最大值,下降最快的一点
2.5 凸函数和凹函数
3 概率统计
3.1 常用统计变量
方差和标准差就是一种离散程度,离散程度越大说明数据的差值距离均值越大,方差越小说明数值越稳定.
均方误差(MSE)和均方根误差(RMSE)和平均绝对误差(MAE)
均方根误差
,亦称标准误差
RMSE
Root Mean Square Error,均方根误差
是观测值与真值偏差的平方和与观测次数m比值的平方根。
是用来衡量观测值同真值之间的偏差
MAE
Mean Absolute Error ,平均绝对误差
是绝对误差的平均值
能更好地反映预测值误差的实际情况.
标准差
Standard Deviation ,标准差
是方差的算数平方根
是用来衡量一组数自身的离散程度
简单来说,标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
3.1.1 数学期望和大数定律
大数定律就是我们从统计学中推测真相的理论基础。
大数定律说如果统计数据足够大,那么事物出现的频率就能无限接近它的期望值。
也就是如果某城市增长到100万人口那么每个家庭中的孩子也就逼近于某个数.
可能不好理解
拿我们最熟悉的投色子举例,游戏规则是投中1点获得1元,投中2点获得2元,以此类推。
这个期望3.5代表什么意思呢?不是最后能拿到3.5元
而是,只要你一直玩下去,你每次游戏的预期收益是3.5元。可能你某次赢了1元,某一次赢了6元,只要你长期投下去, 你平均下来每次就赢3.5元。
3.1.2 协方差
XY随机变量的相关性统计
协方差(Covariance)在概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。概念比较难以理解简单的说:
补充说下:如果是0,也就没啥相关性
3.1.3 相关系数
弥补XY的相似程度的计算,就可以更清晰的得到相关性.
3.2 常见概率分布
正态分布:哔哩哔哩数学大叔
3.3 重要概率公式