开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks这边有个需求,不知道是否能实现?

DataWorks这边有个需求,不知道是否能实现。我想拿到某条任务链的运行时间(ODS-CDM-ADS),然后将这个运行时间写入ads层的表中。有办法实现吗?

展开
收起
真的很搞笑 2024-03-11 14:57:52 19 0
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    可以实现。在DataWorks中,可以通过以下步骤实现将任务链的运行时间写入ADS层的表中:

    1. 首先,在ODS层创建一个表,用于存储任务链的运行时间。例如,可以创建一个名为task_chain_runtime的表,包含任务链ID、开始时间和结束时间等字段。

    2. 在CDM层创建一个视图,用于计算任务链的运行时间。例如,可以创建一个名为task_chain_runtime_view的视图,通过连接ODS层的task_chain_runtime表,计算每个任务链的运行时间。

    3. 在ADS层创建一个表,用于存储从CDM层获取的任务链运行时间。例如,可以创建一个名为ads_task_chain_runtime的表,包含任务链ID和运行时间等字段。

    4. 创建一个ETL作业,用于将CDM层的task_chain_runtime_view视图中的数据写入ADS层的ads_task_chain_runtime表。在作业配置中,设置源表为task_chain_runtime_view,目标表为ads_task_chain_runtime,并设置相应的映射关系。

    5. 最后,运行ETL作业,将任务链的运行时间写入ADS层的表中。

    通过以上步骤,可以实现将任务链的运行时间写入ADS层的表中。

    2024-03-11 22:52:19
    赞同 展开评论 打赏
  • 可以看下openapi getinstance之类的 获取到实例日志 再从日志解析出开始和结束时间https://help.aliyun.com/zh/dataworks/developer-reference/api ,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2024-03-11 16:12:27
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载