备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

dataworks离线数据集成，源库或目标库是MC时，走的是Tunnel？还是走的是datax啊?

dataworks离线数据集成，源库或目标库是MC时，走的是Tunnel？还是走的是datax啊?

展开

收起

真的很搞笑 2023-12-24 13:06:46 136 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

1941623231718325
在阿里云DataWorks中，当进行离线数据集成任务且源库或目标库是MaxCompute（MC）时，会使用DataX作为基础的数据同步工具。关于Tunnel和DataX的使用场景：
- MaxCompute原生提供了Tunnel服务，它主要用于高效地进行大规模数据的上传和下载操作，提供了一种与Hadoop类似的文件系统接口来访问MaxCompute表数据。
- DataWorks中的离线数据集成服务基于开源的DataX工具进行了深度定制和优化，支持多种异构数据源之间的数据迁移。对于MaxCompute作为源库或目标库的任务，DataWorks可能不是直接调用Tunnel API，而是通过封装DataX的MaxCompute Reader/Writer插件来实现数据读写功能，这样可以更好地适应复杂的数据集成需求，并利用DataX提供的稳定性和可靠性。
因此，在DataWorks中进行MaxCompute与其他数据源之间的离线数据集成时，实际上是通过DataX来完成数据同步工作，而非直接使用Tunnel。
2023-12-30 13:57:40

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

DataWorks数据集成在离线同步场景下支持各种类型和网络环境下的数据同步，包括数据库、数仓、NoSQL数据库、文件存储、消息队列等近50多种不同异构数据源之间的数据同步。当源库或目标库是MC时，DataWorks离线数据集成会通过DataX这个阿里云 DataWorks数据集成的开源版本来进行数据的读取和写入。DataX被广泛应用于阿里巴巴集团内，实现了多种异构数据源之间高效的数据同步功能。因此，源库或目标库是MC时，走的是DataX而非Tunnel。

2023-12-25 14:19:28

赞同展开评论
芯在这

离线是datax 底层实际是执行的tunnel ，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-12-25 08:01:33

赞同展开评论

问答分类：

DataX DataWorks 数据集成 Data Integration 大数据开发治理平台 DataWorks

问答标签：

目标云原生大数据计算服务 MaxCompute 大数据开发治理平台 DataWorks集成集成云原生大数据计算服务 MaxCompute 集成datax 集成数据集成 Data Integration

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

EMAS按照官方rn的插件方法集成进去，android点击离线通知的时候，进入RN如何获取推送内容？

125

0

0

应用研发平台EMAS按照官方rn的插件方法集成进去，想在收到离线消息的时候播报一段语音，应该如何实现

99

0

0

想问下应用研发平台EMAS我集成了厂商通道，怎么现在离线推送收不到了，要打开app才显示通知？

200

1

0

DataWorks数据集成的实时同步任务，如果源数据库的数据删掉了，mc的目标表数据的删除策略？

153

1

0

DataWorks分析数据集成节点的独享集成资源资源情况？

139

1

0

DataWorks数据集成公共资源下线，这样批量改是不是就能把所有集成任务的资源组更改？

137

2

0

DataWorks中mc的表和我目标表历史数据的差异，我想定位到是我同步任务的问题？

109

1

0

DataWorks数据同步任务都是 mc -> 阿里的 adb 好像这样不会产生公网流量费用？

139

1

0

DataWorks运行在公共数据集成（调试）资源组中的数据集成任务，应该有两部分收费？

115

1

0

DataWorks怎么计算旧的数据集成任务在公共数据集成资源组，的使用情况呢？

98

2

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

【赵渝强老师】阿里云大数据集成开发平台DataWorks

阿里云EMR Serverless StarRocks 内容合集

阿里云大数据AI产品月刊-2025年8月

智能体创业新风口：从算法开发到IP运营的范式转移——AI智能体如何重塑创新创业的底层逻辑

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

热门讨论

热门文章

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

阿里云磁盘大小是多少？

在智能数据建模中涉及的FML是什么的缩写，什么意思？

数据来源：com.alibaba.fastjson.JSONException: syntax er

Dataphin和 Dataworks 有啥区别呢？

咱们这个API Path什么意思呢，是自定义的接口吗？还是统一规范的？

DataWorks创建表提交到开发、生产环境时报错：列名包含关键字，请修改列名 date，如何解决？

数据服务报429请求次数过多咋办呀

DataWorks中假如odps 有个string字段需要容纳的内容长度超过8M了，我想接进来？

DataWorks表管理创建表报precision and scale is not current

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

语雀+通义千问+DataWorks，让AI定期推送每周总结

DataWorks百问百答69：有哪些数据集成报错（数据集成报错归类）？

基于DataWorks搭建新零售数据中台

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

DataWorks数据安全能力模块介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks数据集成-大数据上下云的核心枢纽 | 《一站式大数据开发治理DataWorks使用宝典》

展开全部

还有其他疑问?