背景
离线调度功能是机器学习的常见场景,用户需要通过离线调度功能,周期性的更新模型。阿里云机器学习PAI可以帮助用户构建模型训练的pipline,大数据开发套件是一套阿里云飞天系统的管理运维平台,目前PAI和大数据开发套件已经打通,可以实现机器学习实验的周期性调度。
第一步.建立PAI实验
首先建立一个机器学习实验,在本案例中我们以一个深度学习实验为例。需要记住实验名以便在调度的时候进行选择,如图红框所示。
第二步.进入大数据开发套件工作空间
进入数加大数据开发套件,如图:
大数据开发套件与机器学习PAI共用一套项目,选择需要调度的实验所在的项目,点击进入工作空间。
第三步.新建节点调度任务
点击新建,选择任务。
在新建任务的配置中,选择节点任务,类型选择机器学习。
第四步.配置调度任务
建立了节点任务之后,可以选择对应的需要调度的机器学习实验,并且可以在右边的配置栏进行配置和相关参数的设定。
点击提交即可,注意:提交的作业从第二天开始生效。
第五步.任务日志查询
提交调度任务之后,可以点击前往运维进行日志查看。
在运维中心可以全方位的观察机器学习任务的运行情况以及系统日志。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
基于您提供的背景和步骤,这里简要概括了如何使用阿里云的机器学习PAI(Platform of Artificial Intelligence)与大数据开发套件(DataWorks,原Data IDE)实现机器学习实验的离线调度功能:
通过上述步骤,您能够有效地将阿里云PAI的机器学习能力与DataWorks的调度和管理功能结合,实现模型训练任务的自动化周期性调度。这种集成不仅提升了工作效率,还便于大规模机器学习项目的运维管理,确保模型能够及时更新以应对数据变化,满足业务需求。