文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks中odps的分区数据如何配置？

DataWorks中odps的分区数据如何配置？

展开

收起

真的很搞笑 2023-08-07 19:04:36 427 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

DataWorks中读取分区表(ODPS)数据时,需要在读取任务中配置分区参数。

配置步骤如下:

选择ODPS表作为源表

在"筛选条件"选项卡下,选择分区字段

配置分区值:

单个分区值:指定单个如'2023-01-01'

多个分区值:使用英文逗号分隔多个值如'2023-01-01,2023-01-02'

范围分区:使用'-'指定开始-结束范围如'2023-01-01-2023-01-31'

全部分区:不指定分区值读取所有分区

分区值两边需要使用单引号括起来

2023-08-10 16:40:46

赞同展开评论
芯在这

读取数据所在的分区信息。ODPS的分区配置支持linux shell通配符，表示0个或多个字符，?表示任意一个字符。默认情况下，读取的分区必须存在，如果分区不存在则运行的任务会报错。如果您希望当分区不存在时任务仍然执行成功，则可以切换至脚本模式执行任务，并在ODPS的Parameter中添加"successOnNoPartition": true配置。例如，分区表test包含pt=1,ds=hangzhou、pt=1,ds=shanghai、pt=2,ds=hangzhou、pt=2,ds=beijing四个分区，则读取不同分区数据的配置如下：如果您需要读取pt=1,ds=hangzhou分区的数据，则分区信息的配置为"partition":"pt=1,ds=shanghai”。
如果您需要读取pt=1中所有分区的数据，则分区信息的配置为"partition":"pt=1,ds=”。
如果您需要读取整个test表所有分区的数据，则分区信息的配置为"partition":"pt=,ds=”。此外，您还可以根据实际需求设置分区数据的获取条件（以下操作需要转脚本模式配置任务）：如果您需要指定最大分区，则可以添加/query/ ds=(select MAX(ds) from DataXODPSReaderPPR)配置信息。
如果需要按条件过滤，则可以添加相关条件/query/ pt+表达式配置。例如/query/ pt>=20170101 and pt<20170110表示获取pt分区中，20170101日期之后（包含20170101日期），至20170110日期之前（不包含20170110日期）的所有数据。说明/query/表示将其后填写的内容识别为一个where条件。
https://help.aliyun.com/document_detail/146663.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-08-07 20:22:32

赞同展开评论

问答分类：

分布式计算 DataWorks MaxCompute 大数据开发治理平台 DataWorks 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute数据云原生大数据计算服务 MaxCompute dataworks 大数据开发治理平台 DataWorks数据云原生大数据计算服务 MaxCompute配置 dataworks云原生大数据计算服务 MaxCompute数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

MaxCompute中python sdk如何配置时区

258

1

0

在表格存储中导到maxCompute后有164696行，是哪里的配置有问题吗？

186

1

0

Dataworks如何配置实现整库的增量数据实时同步

226

1

0

Dataworks提示分区不存在如何解决

301

1

0

MaxCompute quota配额组配置失效

233

1

0

大数据计算MaxCompute Spark中ak信息的配置？有文档么？

208

1

0

DataWorks中insert into后面如果没查出来数据，也会创建新分区吗？

200

0

0

DataWorks如何配置质量校验规则告警，有没有这块文档？

190

1

0

DataWorks【数据地图】分区信息有记录，但是记录数都是-1是什么原因呢？

200

1

0

DataWorks除了用数据地图-查看分区，有查看表分区的sql命令吗？

214

2

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

从问题库到AI回答样本：数据清洗与指标聚合流程

从原始AI回答到可分析指标：数据清洗与口径统一流程

Quick BI使用案例29：MaxCompute含JSON字段表同步失败解决方案

阿里云人工智能平台PAI对接完全指南：从入门到生产级部署

2026免费BI产品选择指南，真实测评与推荐

相关解决方案

更多

海量异构数据预处理破局之道

Agent 赋能企业数据治理

基于数据闪回，快速恢复数据

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

在DataWorks上使用PyODPS使用限制是什么？

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

DataWorks概述API网关是什么？

数据来源：com.alibaba.fastjson.JSONException: syntax er

DateWorks上运行的任务，被kill掉了，日志中能查出来，被谁杀掉了吗？

你好，Dataworks为什么di传输的时候，有个字段传过来之后为空，源端数据不是空，怎么排查原因？

数据服务报429请求次数过多咋办呀

在智能数据建模中涉及的FML是什么的缩写，什么意思？

DataWorks中ODPS SQL 执行计划是什么？

展开全部

云上一指禅：大数据产品DataWorks每日问答

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

DataWorks产品使用合集之如何访问周期任务运维

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

【全新系列】DataWorks百问百答

DataWorks售前咨询

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

展开全部

还有其他疑问?