备案控制台

开发者社区问答正文

Hadoop迁移到MaxCompute的两个部分分别是什么？

Hadoop迁移到MaxCompute的两个部分分别是什么？

展开

收起

游客fbdr25iajcjto 2021-12-12 16:26:09 865 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客7ygkl73u5msna

将Hadoop迁移到MaxCompute会分为两个主要部分：

数据迁移和任务迁移。

首先，对于数据迁移而言，可以通过Datax、数据集成以及DataxOnHadoop这几种工具实现。

Datax是阿里云开源的一款数据传输工具；

而数据集成的底层就是由Datax实现的。如果在数据迁移的过程中要使用Datax，那么需要用户来自定义调度，这对于gateway资源具有一定的要求。

Datax在做数据传输的时候需要有一个管道机，通常就称之为gateway，数据的传输都是通过这个gateway来实现的，因此在使用Datax的时候对于gateway的资源是具有一定的要求的。

此外，数据集成是在DataWorks里面集成化的数据传输工具。

如果想要应用数据集成，那么其调度就是在DataWorks里面完成的，设置完数据周期等一些属性，DataWorks就可以自动实现任务的调度。如果使用数据集成，在网络允许的情况下，可以使用DataWorks的gateway公共网络资源，如果网络不允许则可以使用自定义的调度资源。

2021-12-12 16:31:36

赞同展开评论

问答分类：

分布式计算 Hadoop MaxCompute 云原生大数据计算服务 MaxCompute

问答标签：

迁移云原生大数据计算服务 MaxCompute hadoop云原生大数据计算服务 MaxCompute 云原生大数据计算服务 MaxCompute迁移云原生大数据计算服务 MaxCompute hadoop hadoop迁移

问答地址：

开发者社区 > 大数据 > 问答

相关问答

可以将MaxCompute的数据迁移到Hadoop集群吗？

87

0

0

可以将MaxCompute的数据迁移到Hadoop集群吗？

161

7

0

可以将MaxCompute的存储数据迁移到Hadoop集群吗？

81

0

0

可以将Hadoop数据迁移到MaxCompute吗？

74

0

0

如何将Hadoop数据迁移到MaxCompute？

61

1

0

Hadoop中关系型数据库的表很难在集群中展开放到不同的机器上为什么呢？

924

1

0

新版数据湖对比 Hadoop 集群优势是什么？

679

1

0

flink cdc 一定要打成jar包提交到集群运行吗？能不能像连Hadoop集群一样，通过连接UR

1182

1

0

flink的高可用必须搭建Hadoop 集群吗？

862

1

0

各位，问一个问题，在生产环境使用Flink CDC必需要搭建一个hadoop集群来管理检查点吗？

912

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

相关文章

MaxCompute SQL AI 超轻体验

MaxCompute SQL AI 超轻体验：

告别代码焦虑：MaxCompute SQL AI 让你的数据“开口说话”

只靠国产算力与开源数据，端侧模型预训练行不行？我们做到了全流程开源

云上数据管道太烧钱？别急，我给你捋一捋这三刀该怎么省（存储 / 计算 / 网络）

还有其他疑问?