备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks切分规则是什么？

DataWorks切分规则是什么？

展开

收起

真的很搞笑 2023-05-21 17:55:22 125 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

ReaganYoung

值得去的地方都没有捷径

DataWorks是阿里云提供的一款大数据开发平台，用于数据集成、数据开发、数据运维等多个环节。在DataWorks中，可以通过数据集成任务将数据源中的数据集成到目标位置，在数据集成任务中需要指定切分规则，用于将数据源数据切分为多个分片进行并行处理加快任务执行速度。

DataWorks支持多种切分规则：

按行切分：将数据源数据按照行数平均分配到不同的分片中。按字节数切分：将数据源数据按照每个字节数平均分配到不同的分片中。按文件大小切分：将数据源数据按照每个文件大小平均分配到不同的分片中。日期类型切分：如果数据源中有日期类型的字段，可以按照日期范围进行切分，将同一范围内的数据分配到同一个分片中。自定义切分：用户可以根据特定场景自定义切分规则。在实际应用中，需要结合具体的数据源和任务需求，选择最适合的切分规则。

2023-05-21 21:47:43

赞同展开评论
芯在这

切分规则：关系型数据库在配置同步任务时，切分task数的换算关系：切分的任务数量=5*并发+ 1 。，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-05-21 18:03:06

赞同展开评论

问答分类：

DataWorks 大数据开发治理平台 DataWorks

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

this xml file does not appear to have any style in

48030

10

0

请问下我访问接口不通什么原因 Provisional headers are shown

1754

0

0

购买阿里国外的云服务器是否可以访问谷歌？

80502

47

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

124284

28

0

OSS的endpoint如何查看

36243

6

0

sql server的用户名和密码怎么查啊？

35555

21

0

配置了安全组规则，端口还是无法访问

32271

25

0

设置域名解析如何指向我的服务器url包括端口号

17594

2

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

59509

30

0

Connection reset by peer的常见原因及解决办法

3782

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

数据开发再提速！DataWorks正式接入Qwen3-Coder

分布式×多模态：当ODPS为AI装上“时空穿梭”引擎

大数据AI产品月刊-2025年7月

阿里云EMR Serverless StarRocks 内容合集

阿里云大数据AI产品月刊-2025年8月

热门讨论

热门文章

数据来源：com.alibaba.fastjson.JSONException: syntax er

阿里云磁盘大小是多少？

数据服务报429请求次数过多咋办呀

DataWorks 运行spark节点，程序logger日志无法展示

Dataphin和 Dataworks 有啥区别呢？

DataWorks中78xxxxx_out的输出是什么?

为什么任务一直提示 Job Queueing…？

DataWorks数据同步失败了，这个是什么意思？

DataWorks常用的SQL函数有哪些

兄弟们啊，同步中DI、RI到底什么意思，是什么的缩写？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

火热邀测！DataWorks数据集成支持大模型AI处理

DataWorks操作报错合集之配置项目连通oss数据源 , 报The request signature we calculated does not match the signature you provided.如何解决

欢迎加入DataWorks产品钉钉交流群

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

DataWorks 千万级任务调度与全链路集成开发治理赋能智能驾驶技术突破

IDC：阿里云获2021中国数据治理平台市场份额第一

DataWorks常见问题之replace 分号无法替换如何解决

展开全部

还有其他疑问?