备案控制台

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks数据生成后如何进行分区？

DataWorks数据生成后如何进行分区？

展开

收起

真的很搞笑 2023-06-04 16:30:22 180 0

1 条回答

写回答

取消提交回答

芯在这

由于数据生成后不会发生变化，因此可以很方便地根据数据的生成规律进行分区。较常见的是根据日期进行分区，例如每天1个分区。在RDS数据库中，执行下述语句准备数据。drop table if exists oplog;create table if not exists oplog(optime DATETIME,uname varchar(50),action varchar(50),status varchar(10));Insert into oplog values(str_to_date('2016-11-11','%Y-%m-%d'),'LiLei','SELECT','SUCCESS');Insert into oplog values(str_to_date('2016-11-12','%Y-%m-%d'),'HanMM','DESC','SUCCESS');上述的两条数据作为历史数据，需要先进行一次全量数据同步，将历史数据同步至昨天的分区。在数据开发页面，右键单击业务流程下的表，选择新建表。在新建表对话框中，输入表名（ods_oplog），单击提交。双击ods_oplog表，在右侧的编辑页面单击DDL模式，输入下述建表语句。--创建好MaxCompute表，按天进行分区。create table if not exists ods_oplog(optime datetime,uname string,action string,status string) partitioned by (ds string);配置同步历史数据的任务，详情请参见创建同步任务。测试同步任务成功后，单击节点编辑页面右侧的调度配置，勾选暂停调度并重新提交或发布，避免任务自动调度执行。执行下述语句，向RDS源头表中插入数据作为增量数据。insert into oplog values(CURRENT_DATE,'Jim','Update','SUCCESS');insert into oplog values(CURRENT_DATE,'Kate','Delete','Failed');insert into oplog values(CURRENT_DATE,'Lily','Drop','Failed');配置同步增量数据的任务。在数据来源中设置数据过滤为date_format https://help.aliyun.com/document_detail/137826.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-06-04 16:40:38

赞同展开评论打赏

问答分类：

DataWorks 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks数据大数据开发治理平台 DataWorks数据分区大数据开发治理平台 DataWorks分区大数据开发治理平台 DataWorks数据生成分区

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关产品：

大数据开发治理平台 DataWorks

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

DataWorks中maxcompute如何解除分区数量最大数量为60000的限制呢？

53

1

0

DataWorks中odps表设置的生命周期，后台都是每天几点执行清理超生命周期的分区数据？

51

0

0

dataworks读kafka写maxcompute按照这个update_time分区要怎么排查？

40

0

0

DataWorks配了整库全增量（准实时）的数据同步任务为什么今天没有在ods里创建昨天的分区呢？

71

8

0

DataWorks中maxcompute 下表，如何一次查询分区表的各分区数据条数？

71

1

0

DataWorks离线同步中的分区信息除了${bizdate}，还有别的内置参数吗？

51

0

0

dataworks怎么扫描全量分区默认有限制？

66

2

0

DataWorks这边这些分表同步使用的全增量的同步方式是不是全量同步会把历史数据都放在一个分区里？

57

1

0

DataWorks想加数值切分键，是否有可以绕过querySql配置读取上游OB表分区的办法？

41

1

0

dataworks按日分区的表，同步数据到oss数据源，怎样配置？

72

3

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关产品

大数据开发治理平台 DataWorks

文档详情产品详情

热门讨论

热门文章

兄弟们啊，同步中DI、RI到底什么意思，是什么的缩写？

数据来源：com.alibaba.fastjson.JSONException: syntax er

dataworks里面的stg层、ods层、dwd层、dws层、是怎么分层的呢？

Dataphin和 Dataworks 有啥区别呢？

请教一下DataWorks，doris和starRocks 选型，选哪个？

DataWorks我该如何访问A项目安装了项目的package资源？

数据服务报429请求次数过多咋办呀

请问 Argument list too long怎么解决？

如果不同的RAM子账号由于权限分配原因，看不到别的工作空间下的任务名称，如果重名了怎么办？

DataWorks中odps SQL 参数如何获取前一天的yyyymm？

展开全部

DataWorks智能数据建模全面公测开始啦！

DataWorks售前咨询

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

DataWorks操作报错合集之错误提示“ODPS-0130161: Parse exception - invalid token 'WITH', expect 'SEMICOLON'”，该怎么办

【云栖实录】DataWorks：新一代智能湖仓一体数据开发与治理平台

DataWorks操作报错合集之离线同步时，报错信息"Out of range value for column 'A' at row 1" ，表示什么意思

DataWorks操作报错合集之配置项目连通oss数据源 , 报The request signature we calculated does not match the signature you provided.如何解决

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

展开全部

相关课程

更多

一站式大数据开发治理平台DataWorks初级课程

1220

11

去学习

DataWorks一站式大数据开发治理平台精品课程

8493

35

去学习

相关电子书

更多

DataWorks数据集成实时同步最佳实践（含内测邀请）-2020飞天大数据平台实战应用第一季 立即下载

DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载

基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

相关实验场景

更多