DataWorks配置查看整库离线同步任务背景信息?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在DataWorks中,整库离线同步任务的背景信息涉及到数据集成的源端数据库和目标端数据库类型。这种类型的数据同步任务包括一次性全量同步、周期性全量同步、离线全增量同步、一次性增量同步和周期性增量同步等不同的同步方式。
在实际的业务场景中,由于数据同步通常不能通过一个或多个简单的离线同步或者实时同步任务完成,而是由多个离线同步、实时同步和数据处理等任务组合完成,这就会导致数据同步场景下的配置复杂度非常高。
同时,离线同步任务会通过调度资源组下发到数据集成执行资源组上执行,所以一个离线同步任务将同时耗费一个调度资源。如果离线同步任务长时间运行未释放资源,除了阻塞其他离线任务运行外,可能还将阻塞其他类型的调度任务运行。
因此,为了确保任务运行无误,当您在DataStudio中完成任务开发并发布至生产环境后,您可以进入运维中心管理离线同步任务、监控任务运行状态、修改同步资源组和查看任务运行日志等。
在 DataWorks 中,您可以按照以下步骤查看整库离线同步任务背景信息:
DataWorks支持通过向导模式或脚本模式配置离线同步任务,您可以将分库分表数据同步至目标单表。本文以同步MySQL分库分表数据为例进行说明。https://help.aliyun.com/zh/dataworks/user-guide/synchronize-data-from-tables-in-sharded-databases?spm=a2c4g.11186623.0.i223
背景信息
分库分表要求表结构一致,因此,配置同步任务时,字段映射将按照第一张表结构进行展示。
支持MySQL(支持向导模式)、PolarDB(支持向导模式)、AnalyticDB(支持向导模式)、SQLServer、Oracle、PostgreSQL等类型的数据源,配置分库分表同步任务。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。