DataWorks配置MySQL整库迁移操作步骤是什么?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
**进入数据源管理页面。登录DataWorks控制台。在左侧导航栏,单击工作空间列表。选择工作空间所在地域后,单击相应工作空间后的进入数据集成。在左侧导航栏,单击数据源,进入数据源管理页面。在数据源管理页面,单击右上方的新增数据源,添加一个面向整库迁移的MySQL数据源(clone_database),详情请参见配置MySQL数据源。单击左上方的 图标,选中全部产品 > 数据汇聚 > 数据集成。在左侧导航栏,单击整库迁移。单击相应MySQL数据源后的整库迁移,进入该数据源的整库迁移页面。整库迁移页面包括三个功能区域。
序号 功能区域 描述 ① 待迁移表筛选区 此处将MySQL数据源(clone_database)下的所有数据库表以表格的形式展现出来,您可以根据实际需要批量选择待迁移的数据库表。 ② 高级设置 此处提供了MySQL数据表和MaxCompute数据表的表名称、列名称、列类型的映射转换规则。 ③ 迁移模式、并发控制区 此处可以控制整库迁移的模式(全量、增量)、并发度配置(分批上传、整批上传)、提交迁移任务进度状态信息等。
单击高级设置,您可以根据具体的需求选择转换规则。例如,MaxCompute端建表时统一增加ods_前缀。在迁移模式、并发控制区中,选择同步方式为每日增量,并配置增量字段为gmt_modified。数据集成默认根据您选择的增量字段生成具体每个任务的增量抽取Where条件,并配置DataWorks调度参数(例如unknown),形成针对每天的数据抽取条件。数据集成抽取MySQL库表的数据是通过JDBC连接远程MySQL数据库,并执行相应的SQL语句,从MySQL库中抽取数据。由于是标准的SQL抽取语句,您可以配置Where子句控制数据范围。您 https://help.aliyun.com/document_detail/136935.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。