备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

odps的分区数据如何配置？

odps的分区数据如何配置？

展开

收起

爱喝咖啡嘿 2022-12-19 15:04:53 473 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

游客h6tegs5txrixy

有根据的

2022-12-22 12:51:15

赞同展开评论
范zzhaha

读取数据所在的分区信息。ODPS的分区配置支持linux shell通配符，表示0个或多个字符，?表示任意一个字符。默认情况下，读取的分区必须存在，如果分区不存在则运行的任务会报错。如果您希望当分区不存在时任务仍然执行成功，则可以切换至脚本模式执行任务，并在ODPS的Parameter中添加"successOnNoPartition": true配置。例如，分区表test包含pt=1,ds=hangzhou、pt=1,ds=shanghai、pt=2,ds=hangzhou、pt=2,ds=beijing四个分区，则读取不同分区数据的配置如下：如果您需要读取pt=1,ds=hangzhou分区的数据，则分区信息的配置为"partition":"pt=1,ds=shanghai”。如果您需要读取pt=1中所有分区的数据，则分区信息的配置为"partition":"pt=1,ds=”。如果您需要读取整个test表所有分区的数据，则分区信息的配置为"partition":"pt=,ds=”。此外，您还可以根据实际需求设置分区数据的获取条件（以下操作需要转脚本模式配置任务）：如果您需要指定最大分区，则可以添加/query/ ds=(select MAX(ds) from DataXODPSReaderPPR)配置信息。如果需要按条件过滤，则可以添加相关条件/query/ pt+表达式配置。例如/query/ pt>=20170101 and pt<20170110表示获取pt分区中，20170101日期之后（包含20170101日期），至20170110日期之前（不包含20170110日期）的所有数据。说明/query/表示将其后填写的内容识别为一个where条件。 https://help.aliyun.com/document_detail/146663.html——此答案整理自钉群“DataWorks交流群(答疑@机器人)”

2022-12-19 17:03:40

赞同展开评论

问答分类：

分布式计算 MaxCompute 云原生大数据计算服务 MaxCompute 大数据开发治理平台 DataWorks

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83988

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3893

1

0

this xml file does not appear to have any style in

52032

10

0

重启Docker后报错：Error response from daemon

2417

0

0

sql server的用户名和密码怎么查啊？

37605

21

0

LoRa的网络覆盖能力范围是怎么样的？

3238

1

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

61012

32

0

OSS的endpoint如何查看

37579

6

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3730

1

0

阿里云服务器如何重置系统？

24792

4

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

DataWorks

2707

+ 订阅

相关文章

MaxCompute SQL AI 超轻体验

MaxCompute SQL AI 超轻体验：

告别代码焦虑：MaxCompute SQL AI 让你的数据“开口说话”

只靠国产算力与开源数据，端侧模型预训练行不行？我们做到了全流程开源

云上数据管道太烧钱？别急，我给你捋一捋这三刀该怎么省（存储 / 计算 / 网络）

热门讨论

热门文章

DATAX连接5.7版本mysql数据库报错，连接8.0没问题，URL没有问题

dataworks新增mysql数据源-ecs自建数据库，连通性测试报错，这个怎么解决呢？

DataWorks还有一个问题,我这个实时同步任务每7天failover一次,这个正常吗？

DataWorks运维中心的运行诊断功能在进行任务诊断时包括哪几部分？

DataWorks常见问题实时任务，运行报错：？

DataWorks ODPS SQL任务中使用调度参数是什么？

dataworks 数据集成里同步任务的时候报错了，请问是什么原因呢？

DataWorks点击数据质量-最近一次运行记录-随便一个规则，页面会白屏？

DataWorks 为啥在开发环境代码运行没问题，生产环境运行报错，而且这个错事啥意思？

DataWorks实时同步任务没办法自动重启吗？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

数据管理能力成熟度模型

语雀+通义千问+DataWorks，让AI定期推送每周总结

基于DataWorks搭建新零售数据中台

【云栖实录】DataWorks：新一代智能湖仓一体数据开发与治理平台

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

【赵渝强老师】阿里云大数据集成开发平台DataWorks

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

展开全部

还有其他疑问?