文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

云原生大数据计算服务 MaxCompute数据上云方面，数据集成同步解决方案是怎样的？

已解决

云原生大数据计算服务 MaxCompute数据上云方面，数据集成同步解决方案是怎样的？

展开

收起

詹姆斯邦德00 2022-10-17 10:57:17 1117 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

胡嘞嘞

推荐回答

有DataWorks等数据平台开发经验的大数据从业者对业务流程、DAG、调度编排等词汇耳熟能详，这些词汇都描述或提示了大数据开发的一般流程。通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。

这里以DataWorks来举例说明，一般是需要在DataStudio数据开发页面中，创建某个分析需求的业务流程，然后在业务流程中配合使用各类节点（逻辑类、数据同步类、各类计算引擎节点等），最终将这些不同类型的节点，根据业务逻辑关系，编排成有向无环图（DAG）。

如果是简单的A表B表的周期离线同步，那只要在业务流程中添加一个离线同步节点，完整源端、目标端数据源配置及网络打通，基于脚本或向导配置好管道，即可完成。但实际业务场景下，数据同步通常不能通过一个或多个简单离线同步或者实时同步任务完成，而是由多个离线同步、实时同步和数据处理等任务组合完成，这就会导致数据同步场景下的配置复杂度非常高。

为了解决上述问题，DataWorks提出了面向业务场景的同步任务配置化方案（我们称之为同步解决方案），支持不同数据源的一键同步功能，例如，“一键实时同步至MaxCompute”、“一键实时同步至Hologres”功能等，通过此类功能，只需要进行简单的配置，就可以完成一个复杂业务场景。而通过传统的手工拖拽节点进行编排的方式，可能需要操作5+甚至10+个节点，配置项达到上百个（涉及周期、参数、依赖关系等各类配置）。

例如：一键实时同步至MaxCompute（独立merge天周期），可能包含了5个数据开发节点和2个资源文件。7个文件可以在一个解决方案向导中轻松配置完成。

以上内容摘自《企业级云原生白皮书项目实战》电子书，点击https://developer.aliyun.com/ebook/download/7774可下载完整版

2022-10-17 18:56:48

赞同展开评论

问答分类：

分布式计算 Cloud Native 大数据 MaxCompute 云原生大数据计算服务 MaxCompute 数据集成 Data Integration

问答标签：

数据集成 Data Integration数据大数据集成云原生集成数据集成 Data Integration maxcompute 集成同步

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

DataWorks如果数据集成源是oss的话能做到实时监听同步吗？

228

1

0

DataWorks配置了个datax同步任务，但是同步速度很慢几十kb/s，能帮忙看下吗？

488

1

0

在大数据计算MaxCompute中，TASKS_HISTORY 能查到数据集成的任务使用情况嘛？

255

2

0

在大数据计算MaxCompute中，数据集成可以同步es的_id到odps吗？

237

1

0

DataWorks数据集成页面同步的表可以放在这边业务流程中吗？

281

12

0

大数据计算MaxCompute的dataX离线同步，针对业务表太大的情况，内部会分页循环嘛？

227

1

0

DataWorks在使用dataworks的数据集成，配置整库全量同步任务怎么办？

309

0

0

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

3013

1

0

大数据中maxcompute跟emr的区别是什么呢？

1060

1

0

云原生大数据计算服务 MaxCompute里，运维中最重要的模块是谁？

1095

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

开发者社区官方技术圈

70179

+ 订阅

阿里云开发者社区官方技术圈，用户产品功能发布、用户反馈收集等。

相关文章

应用和云服务排障：可观测能力应该提前设计

大数据架构运维成本太高怎么降？多模托管一站式方案

[鸿蒙从零到一] ArkUI Canvas 绘制实战：坐标、路径、交互与性能优化

云原生应用别把稳定性交给业务代码：统一 API 入口应该尽早设计

AI 应用和云服务排障：可观测能力应该提前设计

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

在大数据计算MaxCompute有碰到不同的字段顺序，存储大小差很多的例子吗？

问一下我现在使用大数据计算MaxCompute，容量不足，申请了存储空间，发给我一个tenanid?

请问一下大数据计算MaxCompute，支持的records数据类型是什么？

大数据计算MaxCompute存储按量付费 100T一天要400元有没有包月的?

大数据计算MaxCompute的trunc函数怎么不能用？

DataWorks连接MaxCompute引擎失败参数校验错误:[name]非法取值,需要？

在导航栏无法定位到相关文件，在运维中心点击编辑节点，可以定位，但无法保存提交，请问是什么原因导致

为什么大数据计算MaxCompute执行函数，一直无法出结果？即使是内置的sum函数都出不来结果。

展开全部

大数据环境下该如何优雅地设计数据分层

odps是什么?

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

优酷背后的大数据秘密

吴刚专访--大数据和 MaxCompute 技术和故事

2017杭州云栖大会FAQ（持续更新中）

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

展开全部

还有其他疑问?