热门
随机梯度下降法,对数据很敏感,错了一个,前面的计算都前功尽弃了
全批量梯度下降:比较稳定,但是计算量很大
小批量梯度优化,第一次取前256,第二次往后再取256,比较稳定,计算量也能接受
个人觉得第一种比较好理解 牛顿法的限制,只有在最优解附近才能比较精确
个人觉得第一种比较好理解
牛顿法的限制,只有在最优解附近才能比较精确
牛顿下降法是二次收敛