DataWorks使用 api 创建的数据集成任务怎么提交和运行?没有找到相关文档? api 提交数据集成任务
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在阿里云DataWorks中,通过API创建的数据集成任务需要经过提交和运行两个关键步骤才能正式生效并执行。以下是详细的流程和操作说明:
首先,您需要使用CreateDIJob
接口创建数据集成任务。该接口会返回一个任务ID(DIJobId
),用于后续操作。
请求参数:
ProjectId
:指定DataWorks工作空间的ID。JobName
:任务名称。MigrationType
:同步类型(如全量或实时增量)。SourceDataSourceType
:源端数据源类型(如MySQL)。DestinationDataSourceType
:目标端数据源类型(如Hologres)。返回参数:
RequestId
:请求ID。DIJobId
:创建的任务ID。在DataWorks中,创建的任务默认处于未提交状态,需要通过以下方式提交到生产环境:
DataWorks支持通过发布流程将开发环境中的任务提交到生产环境。您可以调用以下API完成相关操作:
获取发布流程列表: 使用ListDeployments
接口查询当前工作空间的发布流程列表。
获取发布流程详细信息: 使用GetDeployment
接口查看具体的发布流程信息,确认是否包含您创建的任务。
手动提交任务: 如果API未直接提供提交功能,您可以通过DataWorks控制台手动提交任务:
注意:如果任务依赖的数据源已被删除或修改,请先通过批量操作修改任务数据源,并重新提交。
提交完成后,您可以使用以下API启动任务:
调用StartDIJob
接口启动数据集成任务。
请求参数:
DIJobId
:任务ID。RealtimeStartSettings
:实时同步启动设置(仅适用于实时任务)。FailoverSettings
:Failover设置。ForceToRerun
:是否强制重跑全部同步步骤。返回参数:
RequestId
:请求ID。启动任务后,您可以使用以下API监控任务运行状态:
获取任务运行信息: 调用ListDIJobRunDetails
接口查看任务的运行详情。
获取任务日志: 调用GetDIJobLog
接口查看任务日志,排查可能的错误。
如果任务运行异常或需要中断,可以调用StopDIJob
接口停止任务。
请求参数:
DIJobId
:任务ID。返回参数:
RequestId
:请求ID。CreateDIJob
和StartDIJob
需要dataworks:*
的写入权限。CreateDIAlarmRule
接口创建告警规则。通过API创建的数据集成任务需要先提交到生产环境,然后通过StartDIJob
接口启动运行。如果遇到问题,可以通过日志和运行信息进行排查。请确保任务依赖的数据源和权限配置正确,以避免运行失败。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。