备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

你好想请教一下，DataWorks中由于数据很大，原端还没有适合的字段做切分键，现在同步数据到？

你好想请教一下，DataWorks中由于数据很大，原端还没有适合的字段做切分键，现在同步数据到odps里特别慢这种怎么搞呀

展开

收起

真的很搞笑 2023-05-22 18:21:03 144 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

武当张三丰丶

存在即是合理
如果原端没有适合的字段做切分键，可以考虑使用DataWorks中的分区功能来实现数据同步。

具体来说，可以按照以下步骤进行操作：
1. 在DataWorks中创建一个新表，用于接收同步的数据。该表需要至少包含一个字段作为切分键。
2. 配置源端和目标端之间的数据同步任务，并将源端表和目标端表都指定为同步任务的数据源。
3. 在同步任务的配置界面中，选择目标端表的分区方式。可以选择基于时间或者基于其他字段进行分区。需要注意的是，不同的分区方式可能对数据同步的性能和可靠性产生不同的影响。
4. 启动同步任务并等待同步完成。在同步过程中，DataWorks会根据切分键将源端数据分配到不同的分区中，从而实现数据的切分和合并。
通过使用DataWorks的分区功能，即使原端没有适合的字段做切分键，也可以实现高效、可靠的数据同步。
2023-05-23 15:39:47

赞同展开评论

问答分类：

分布式计算 DataWorks MaxCompute 大数据开发治理平台 DataWorks 云原生大数据计算服务 MaxCompute

问答标签：

大数据开发治理平台 DataWorks数据大数据开发治理平台 DataWorks同步大数据开发治理平台 DataWorks字段大数据开发治理平台 DataWorks数据字段大数据开发治理平台 DataWorks切分

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks生成的任务个数的规则是什么，能自己配置切分后的任务数量吗？

101

2

0

DataWorks有什么方法可以自动把新增字段的映射加上再同步任务？

92

1

0

DataWorks已申请过字段级别权限，查询时还是提示没有权限，必须要重新申请，是平台有bug吗？

99

1

0

使用新版 dataworks同步数据，字段映射的时候没有办法选择分区字段？

88

1

0

DataWorks中di节点能否同时使用两个字段作为切分键？

88

1

0

大数据计算MaxCompute的dataworks执行任务的时候，会不会自己选择最优的切分方式？

69

0

0

DataWorks数据分析师角色在哪里可以看到授权于我的查询的字段？

126

1

0

DataWorks有办法我自己写SQL查询 maxcompute 的表总数与字段总数不？

87

1

0

DataWorks如何查询odps的表总数、字段总数？

1196

11

0

这个dataworks分区字段都写*的情况下怎么能将分区字段的数据一起同步呢？

65

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

阿里云渠道商：如何快速使用阿里云ECS？

DMS Airflow：企业级数据工作流编排平台的专业实践

阿里云大数据AI产品月刊-2025年10月

一、Scala 基础语法、变量与数据类型

告别繁琐循环：用Java Stream优雅处理集合

热门讨论

热门文章

数据来源：com.alibaba.fastjson.JSONException: syntax er

咱们这个API Path什么意思呢，是自定义的接口吗？还是统一规范的？

Dataphin和 Dataworks 有啥区别呢？

数据服务报429请求次数过多咋办呀

阿里云磁盘大小是多少？

DataWorks中假如odps 有个string字段需要容纳的内容长度超过8M了，我想接进来？

DataWorks表管理创建表报precision and scale is not current

DataWorks failed: ODPS-0121145:Data overflow - 0 ？

DataWorks set odps.service.mode = off;？

DataWorks这个缺少必填参数，是什么意思？说没有指定reader插件odps的column？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

欢迎加入飞天大数据平台交流群

基于DataWorks搭建新零售数据中台

语雀+通义千问+DataWorks，让AI定期推送每周总结

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

火热邀测！DataWorks数据集成支持大模型AI处理

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks百问百答69：有哪些数据集成报错（数据集成报错归类）？

展开全部

还有其他疑问?