DataWorks任务调度的优先级?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在阿里云大数据开发治理平台DataWorks中,任务调度的优先级是通过基线管理和任务优先级配置来实现的。以下是详细的说明:
任务优先级决定了任务在资源紧张的情况下能否优先获得调度资源。优先级的取值范围为1、3、5、7、8
,数值越大,优先级越高。
1
。MaxCompute作业优先级 = 9 - DataWorks基线优先级
例如,DataWorks基线优先级为5
时,对应的MaxCompute作业优先级为4
。 - 对于EMR节点任务,可以通过设置基线优先级与YARN队列优先级的映射关系,调整任务的执行资源分配。
任务优先级的设置需要通过基线管理功能完成,具体步骤如下:
进入基线管理页面:
创建或编辑基线:
配置基线属性:
1、3、5、7、8
)。保存配置:
任务优先级可以在以下位置查看:
运维中心 > 实例属性:
MaxCompute任务历史查询:
information_schema.tasks_history
表,定位优先级非9
的作业。示例查询如下:SELECT inst_id, owner_name, task_name, task_type, settings
FROM information_schema.tasks_history
WHERE ds = '${bizdate}'
AND get_json_object(REPLACE(settings, '.', '_'), '$.odps_instance_priority') = '${priority}'
LIMIT 100;
bizdate
:日期分区,例如20200517
。priority
:优先级数值,例如2
。高优先级任务的优势:
注意事项:
冻结周期任务:
冻结实例:
资源分类:
任务状态与优先级:
NOT_RUN
(未运行)、WAIT_RESOURCE
(等待资源)、RUNNING
(运行中)等。WAIT_RESOURCE
状态下更容易获得资源。通过以上机制,您可以灵活配置和管理DataWorks任务的调度优先级,确保重要任务能够按时完成并满足业务需求。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。