开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中调度资源组使用率100%应该怎么处理?

DataWorks中调度资源组使用率100%应该怎么处理?

展开
收起
cuicuicuic 2023-07-11 13:23:37 71 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    在DataWorks中,调度资源组使用率达到100%时,可能会导致调度任务失败或者长时间等待,影响任务的正常运行。为此,可以考虑以下几种方式来处理:

    扩容调度资源组:如果调度资源组的使用率达到了100%,可以考虑扩容调度资源组的容量,以增加调度任务的处理能力。在DataWorks中,可以通过增加调度节点的数量、升级调度节点的配置等方式来扩容调度资源组。

    调整调度任务的优先级:如果调度资源组的使用率达到了100%,可以考虑调整调度任务的优先级,以确保重要任务能够及时得到处理。在DataWorks中,可以通过设置调度任务的优先级来调整任务的执行顺序和优先级。

    优化调度任务的资源占用:如果调度任务的资源占用率过高,可能会导致调度资源组的使用率达到100%。此时,可以考虑优化调度任务的资源占用,例如减少任务的并行度、优化任务的SQL语句等方式,以降低调度资源组的负载。

    2023-07-30 21:57:04
    赞同 展开评论 打赏
  • 【等待gateway资源】
    当前任务执行资源组并发达到上限,需要等待运行中的任务执行完成释放资源。

    使用公共调度资源组,您可以在运维大屏处查看。
    使用独享调度资源组,您可以使用在控制台查看该资源组当前执行的任务列表。


    【排查案例一:生产任务等待调度资源gateway】
    背景:

    运维中心大量生产任务在等待调度资源,日志显示“任务并发数已达上限,正在等待在云端的gateway资源...”,但是找不到在运行中的任务,阻塞业务。

    排查:

    1)确认调度资源组类型:
    公共:租户级别下(该租户所有region所有项目),公共资源组支持的并发数有限制,参见官方文档
    独享:规格参见官方文档
    自定义:参见官方文档
    2)DataWorks专业版以上运行诊断功能可以直接找到占用资源任务。
    3)非专业版以上,使用该资源组的所有region、所有项目按运行状态“运行中”过滤筛选。
    image.png

    4)排查这些运行中的任务迟迟不释放资源的原因,查看日志。

    如果是离线同步任务,大概率是二级数据集成同步资源槽位不够,任务一直在等待同步资源(detail log日志中长时间打印wait)(大概率原因)。
    如果是odps sql等计算任务,日志打印queue说明任务在等待计算资源,或logview中长尾数据倾斜导致计算慢需联系MaxCompute或对应计算引擎同学。

    解决:

    1)终止优先级低占用调度资源的任务,让重要的任务先跑。
    2)公共资源组上的任务迁移独享后补数据跑。
    3)独享资源组扩容。

    【资源组使用率】
    控制台-资源组列表-使用率点击进去

    image.png
    image.png
    ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-11 14:54:15
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    被窝里的运维——DataWorks移动版公测-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多