开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks中interrupted状态下的job会自动重新跑吗?

DataWorks中interrupted状态下的job会自动重新跑吗?image.png

展开
收起
cuicuicuic 2024-02-06 08:23:14 20 0
1 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    DataWorks中interrupted状态的job不会自动重新运行。

    在DataWorks中,如果一个任务(job)因为某些原因被中断(interrupted),它不会自动重新开始。中断可能由多种因素引起,比如资源问题、系统错误或其他异常情况。一旦任务中断,你需要手动进行干预。具体如下:

    1. 检查任务详情:首先,你应该在运维中心查看任务的运行详情,以确定中断的原因。
    2. 数据完整性:由于中断可能导致数据不一致,你需要确保数据的完整性和准确性。如果任务在执行过程中被中断,已经处理的数据不会自动回滚,也不会自动重跑。
    3. 手动重跑:如果需要,你可以使用DataWorks提供的强制重跑下游功能来手动重新调度指定的节点及其下游节点。但请注意,这个操作有一些限制,比如只有特定的用户角色可以发起操作,且仅支持业务日期为昨天和前天的周期实例。
    4. 配置调度依赖:为了避免未来任务中断,你应该正确配置调度依赖,确保任务之间的上下游关系清晰,以便DataWorks可以根据这些依赖关系有序地运行业务流程中的各个节点。
    5. 选择计算引擎:根据任务的具体需求,你可以选择不同的数据计算引擎(如EMR、MaxCompute等)来执行任务。不同的计算平台可能有不同的容错和恢复机制,因此选择合适的计算引擎对于任务的稳定性和可靠性至关重要。

    总结来说,当DataWorks中的任务处于interrupted状态时,你需要手动介入以确保任务能够正确完成。这可能包括检查任务详情、手动重跑任务或调整任务配置,以保证数据处理的准确性和完整性。

    2024-02-06 17:48:37
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多