十七、大规模机器学习和随机梯度下降(SGD)

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 十七、大规模机器学习和随机梯度下降(SGD)

1、随机梯度下降-Stochastic Gradient Descent


随机梯度下降是相对于批量梯度下降(batch gradient descent)提出的,目的在训练集数据非常大时,加快求解梯度的速度。不同于梯度下降中,每次计算梯度的时候需要计算所有训练数据的梯度,SGD每次只计算一个样本的梯度,使用计算出来的梯度对参数  θ进行更新,SGD的流程如下所示:


6cd8b14a500647cc9ca6e491cd1fb14d.png

外层循环的次数通常选取1-10次。



2、小批量梯度下降 - Mini-batch Gradient descent


小批量梯度下降介于批梯度下降和随机梯度下降之间,批梯度下降使用全部的训练样本来计算梯度;随机梯度下降每次只使用一个训练样本来计算梯度;而小批量梯度下降每次使用 b ∈ [ 2 , 100 ] b \in [2,100] b∈[2,100](mini batch size)个训练样本来计算梯度。小批量梯度下降的流程如下所示:


2d1e1210b98049fea80fa90a8dc30f54.png



3、随机梯度下降算法的收敛性


在使用批梯度下降算法时,判断收敛的方法是通过绘制成本函数  Jθ关于迭代次数的图像来观察成本是否随着迭代次数增加而减小;而在SGD中,通常采用的方法是:每隔1000次迭代,绘制前1000次迭代中单个样本的成本 cost(θ,(xi,yi)),从而观察成本是否随着迭代次数增大而减小。


031e9fbe872b4f4186d7cbd01560be6b.png



在SGD中,学习率  α通常是保持不变的,但是如果我们想得到更好的收敛效果,可以让 α=iterationNum+const2const1,但是这种方法需要仔细校准参数  const1和 const2的值。




4、在线学习-Online Learning


在线学习处理的是连续输入的数据流,同时需要一个模型从这些连续输入的数据中进行学习。下面是一个在线学习的情景:某个提供运输服务的网站,会不断有顾客点进网站,规定起终点,然后通过网站的报价来购买运输服务;当得到网站的报价之后,某些顾客选择使用网站提供的运输服务(y=1),有些顾客选择不使用网站提供的运输服务(y=0)。令特征 x x x记录顾客的特征,如规定的起终点,询问的报价等,在线学习模型需要优化网站的报价价格,p(y=1∣x;θ)。运输网站的在线学习的模型如下所示:



b07a648737ea4643aab0717c389b7f65.png




5、映射约减-map reduce



映射约减的思想是将本来一台计算机需要完成的任务分给几台计算机进行并行计算,从而提高计算效率。

5935c7bdd9d94a1a9a7bccd75eeda4f2.png






相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
机器学习/深度学习 存储 文字识别
图解来啦!机器学习工业部署最佳实践!10分钟上手机器学习部署与大规模扩展 ⛵
如何快速部署机器学习模型?本文是机器学习工业部署的 best practice(最佳实践)!详细讲解了如何操作机器学习开源框架 BentoML,帮助研发团队轻松打包机器学习模型,并重现该模型以用于生产。
1530 4
图解来啦!机器学习工业部署最佳实践!10分钟上手机器学习部署与大规模扩展 ⛵
|
9月前
|
机器学习/深度学习 SQL 数据采集
使用SQL和机器学习进行大规模自动化数据质量测试
使用SQL和机器学习进行大规模自动化数据质量测试
|
10月前
|
机器学习/深度学习 算法 搜索推荐
【吴恩达机器学习笔记】十五、大规模机器学习
【吴恩达机器学习笔记】十五、大规模机器学习
60 0
|
机器学习/深度学习
《机器学习在大规模服务器治理复杂场景的实践》电子版地址
机器学习在大规模服务器治理复杂场景的实践
|
机器学习/深度学习 分布式计算 Spark
|
机器学习/深度学习 自然语言处理 算法
机器学习--决策树、线性模型、随机梯度下降
机器学习--决策树、线性模型、随机梯度下降
188 0
机器学习--决策树、线性模型、随机梯度下降
|
机器学习/深度学习 分布式计算 Apache
《基于Apache Spark 的大规模分布式机器学习实践》电子版地址
基于Apache* Spark* 的大规模分布式机器学习实践
99 0
《基于Apache Spark 的大规模分布式机器学习实践》电子版地址
|
机器学习/深度学习 算法 索引
机器学习中的数学原理——随机梯度下降法
机器学习中的数学原理——随机梯度下降法
327 0
机器学习中的数学原理——随机梯度下降法
|
机器学习/深度学习
《大规模机器学习在蚂蚁+阿里的应用》电子版地址
大规模机器学习在蚂蚁+阿里的应用
76 0
《大规模机器学习在蚂蚁+阿里的应用》电子版地址
|
机器学习/深度学习
《大规模机器学习在蚂蚁+阿里的应用》电子版地址
大规模机器学习在蚂蚁+阿里的应用
45 0
《大规模机器学习在蚂蚁+阿里的应用》电子版地址

热门文章

最新文章