GD算法的改进算法
1、SGD算法
(1)、mini-batch
如果不是每拿到一个样本即更改梯度,而是若干个样本的平均梯度作为更新方向,则是mini-batch梯度下降算法。
(1)、SGD与学习率、Rate、Loss
GD算法中的超参数
1、学习率
(1)、固定学习率实验的C代码
(2)、回溯线性搜索(Backing Line Search)
(3)、二次插值线性搜索:回溯线性搜索的思考——插值法,二次插值法求极值
1、SGD算法
(1)、mini-batch
如果不是每拿到一个样本即更改梯度,而是若干个样本的平均梯度作为更新方向,则是mini-batch梯度下降算法。
(1)、SGD与学习率、Rate、Loss
1、学习率
(1)、固定学习率实验的C代码
(2)、回溯线性搜索(Backing Line Search)
(3)、二次插值线性搜索:回溯线性搜索的思考——插值法,二次插值法求极值