文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

关于 DataWorks，odps的分区数据如何配置？

关于 DataWorks，odps的分区数据如何配置？

展开

收起

wenti 2023-01-29 20:32:17 509 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

665661

读取数据所在的分区信息。ODPS的分区配置支持linux shell通配符，表示0个或多个字符，?表示任意一个字符。默认情况下，读取的分区必须存在，如果分区不存在则运行的任务会报错。如果您希望当分区不存在时任务仍然执行成功，则可以切换至脚本模式执行任务，并在ODPS的Parameter中添加"successOnNoPartition": true配置。例如，分区表test包含pt=1,ds=hangzhou、pt=1,ds=shanghai、pt=2,ds=hangzhou、pt=2,ds=beijing四个分区，则读取不同分区数据的配置如下：如果您需要读取pt=1,ds=hangzhou分区的数据，则分区信息的配置为"partition":"pt=1,ds=shanghai”。如果您需要读取pt=1中所有分区的数据，则分区信息的配置为"partition":"pt=1,ds=”。如果您需要读取整个test表所有分区的数据，则分区信息的配置为"partition":"pt=,ds=”。此外，您还可以根据实际需求设置分区数据的获取条件（以下操作需要转脚本模式配置任务）：如果您需要指定最大分区，则可以添加/query/ ds=(select MAX(ds) from DataXODPSReaderPPR)配置信息。如果需要按条件过滤，则可以添加相关条件/query/ pt+表达式配置。例如/query/ pt>=20170101 and pt<20170110表示获取pt分区中，20170101日期之后（包含20170101日期），至20170110日期之前（不包含20170110日期）的所有数据。说明/query/表示将其后填写的内容识别为一个where条件。——该回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-01-29 21:18:24

赞同展开评论

问答分类：

分布式计算 DataWorks MaxCompute 大数据开发治理平台 DataWorks 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute数据云原生大数据计算服务 MaxCompute dataworks 大数据开发治理平台 DataWorks数据云原生大数据计算服务 MaxCompute配置 dataworks云原生大数据计算服务 MaxCompute数据

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

MaxCompute中python sdk如何配置时区

258

1

0

在表格存储中导到maxCompute后有164696行，是哪里的配置有问题吗？

188

1

0

MaxCompute quota配额组配置失效

238

1

0

大数据计算MaxCompute Spark中ak信息的配置？有文档么？

210

1

0

大数据计算MaxCompute这个配置怎么购买才知道可用啊？

227

1

0

DataWorks如何配置MaxCompute监控进行订阅管理？

246

6

0

Maxcompute中python脚本如何配置sql参数

240

1

0

MaxCompute项目如何配置时区

257

1

0

大数据计算MaxCompute这个如何配置啊？需要像jdbc模式一样配置外表吗？

189

1

0

使用dataworks 从 es同步至odps，如何配置才能同步到odps？

220

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

DataWorks

2707

+ 订阅

相关文章

从品牌指标到诊断报告：结果解释与边界声明的数据工程实践

阿里云MaxCompute云原生大数据计算服务全方位对接使用指南

六款Vibe Coding工具横向对比：PySpark大数据缺陷识别与迭代落地指南

阿里云EMR大数据集群网站运营数据统计完全实战指南

GPT-5.6 Sol & Subagent 不但聪明，更会分工

相关解决方案

更多

海量异构数据预处理破局之道

Agent 赋能企业数据治理

基于数据闪回，快速恢复数据

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

在DataWorks上使用PyODPS使用限制是什么？

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

DataWorks概述API网关是什么？

DateWorks上运行的任务，被kill掉了，日志中能查出来，被谁杀掉了吗？

数据来源：com.alibaba.fastjson.JSONException: syntax er

在智能数据建模中涉及的FML是什么的缩写，什么意思？

Maxcompute分区表支持删除数据吗？

DataWorks当前使用的ram账户能访问oss，点那个文件夹会报错？

DataWorks中ODPS SQL 执行计划是什么？

展开全部

云上一指禅：大数据产品DataWorks每日问答

DataWorks AI助理：在钉钉让AI助理帮你盯任务、修问题

欢迎加入飞天大数据平台交流群

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

【全新系列】DataWorks百问百答

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks产品使用合集之如何访问周期任务运维

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

DataWorks售前咨询

展开全部

还有其他疑问?