备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

云原生大数据计算服务 MaxCompute数据上云方面，数据集成同步解决方案是怎样的？

已解决

云原生大数据计算服务 MaxCompute数据上云方面，数据集成同步解决方案是怎样的？

展开

收起

詹姆斯邦德00 2022-10-17 10:57:17 1013 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

胡嘞嘞

推荐回答

有DataWorks等数据平台开发经验的大数据从业者对业务流程、DAG、调度编排等词汇耳熟能详，这些词汇都描述或提示了大数据开发的一般流程。通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。

这里以DataWorks来举例说明，一般是需要在DataStudio数据开发页面中，创建某个分析需求的业务流程，然后在业务流程中配合使用各类节点（逻辑类、数据同步类、各类计算引擎节点等），最终将这些不同类型的节点，根据业务逻辑关系，编排成有向无环图（DAG）。

如果是简单的A表B表的周期离线同步，那只要在业务流程中添加一个离线同步节点，完整源端、目标端数据源配置及网络打通，基于脚本或向导配置好管道，即可完成。但实际业务场景下，数据同步通常不能通过一个或多个简单离线同步或者实时同步任务完成，而是由多个离线同步、实时同步和数据处理等任务组合完成，这就会导致数据同步场景下的配置复杂度非常高。

为了解决上述问题，DataWorks提出了面向业务场景的同步任务配置化方案（我们称之为同步解决方案），支持不同数据源的一键同步功能，例如，“一键实时同步至MaxCompute”、“一键实时同步至Hologres”功能等，通过此类功能，只需要进行简单的配置，就可以完成一个复杂业务场景。而通过传统的手工拖拽节点进行编排的方式，可能需要操作5+甚至10+个节点，配置项达到上百个（涉及周期、参数、依赖关系等各类配置）。

例如：一键实时同步至MaxCompute（独立merge天周期），可能包含了5个数据开发节点和2个资源文件。7个文件可以在一个解决方案向导中轻松配置完成。

以上内容摘自《企业级云原生白皮书项目实战》电子书，点击https://developer.aliyun.com/ebook/download/7774可下载完整版

2022-10-17 18:56:48

赞同展开评论

问答分类：

分布式计算 Cloud Native 大数据 MaxCompute 云原生大数据计算服务 MaxCompute 数据集成 Data Integration

问答标签：

云原生大数据云原生大数据计算服务 MaxCompute大数据云原生计算云原生大数据计算服务 MaxCompute MaxCompute 云原生大数据计算服务 MaxCompute数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

在大数据计算MaxCompute中，TASKS_HISTORY 能查到数据集成的任务使用情况嘛？

117

2

0

在大数据计算MaxCompute中，数据集成可以同步es的_id到odps吗？

105

1

0

dataworks数据集成，使用RestAPI导入数据时，date类型的数据，应该以什么样的值传入？

79

1

0

dataworks的数据集成中，离线同步支不支持数据的脱敏或加密？

108

1

0

大数据计算MaxCompute的dataX离线同步，针对业务表太大的情况，内部会分页循环嘛？

112

1

0

大数据计算MaxCompute的数据集成这块报错是什么原因？

118

1

0

云原生数据仓库AnalyticDB PostgreSQL 版有哪些核心功能？

1209

1

0

云原生数据仓库AnalyticDB PostgreSQL 版有什么优势？

1145

1

0

云原生数据仓库AnalyticDB PostgreSQL 版的产品定位是什么？

1070

1

0

为什么说云原生数据仓库AnalyticDB PostgreSQL 版具有数据多模分析的特性？

1060

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

收录在圈子:

开发者社区官方技术圈

70106

+ 订阅

阿里云开发者社区官方技术圈，用户产品功能发布、用户反馈收集等。

相关文章

阿里云大数据AI产品月刊-2025年9月

Linux环境下 java程序提交spark任务到Yarn报错

Arista cEOS 4.35.0F 发布 - 针对云原生环境设计的容器化网络操作系统

云栖重磅｜瑶池数据库：从云原生数据底座向“AI就绪”的多模态数据底座演进

jdk25

热门讨论

热门文章

大数据计算MaxCompute的datawork做数据同步的时候，可以解决源系统表名不固定的情况嘛？

阿里云和腾讯云服务器哪个好！

大数据计算MaxCompute看后续的日志文件中提示请求头异常？

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

DataWorks maxcompute 计算资源只用到40CU 只能50CU 起卖吗？

大数据计算MaxCompute配置参数在开发环境进行调度，参数解析不出来，这是需要额外做什么配置吗？

阿里云一个CU对应多少cpu和内存?

大数据计算MaxCompute有一个任务，等待资源时间，持续20分钟了以前10分钟左右就会执行完的？

大数据计算MaxCompute钉钉机器人发报警webhook调用量到上限了，这个怎么处理？

大数据计算MaxCompute里 \r\n是用的什么字符，数据里有换行符，用replace怎么替?

展开全部

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

优酷背后的大数据秘密

干货：解码OneData，阿里的数仓之路。

品《阿里巴巴大数据实践-大数据之路》一书（上）

MaxCompute常见错误汇总（更新ing）

品《阿里巴巴大数据实践-大数据之路》一书(下)

大数据阿里云产品的简单介绍理解

互联网下半场的角逐，玩转轻资产的大数据服务 | 阿里云栖开发者沙龙大数据专场（北京站）干货集锦

MaxCompute/DataWorks权限问题排查建议

展开全部

还有其他疑问?