文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

DataWorks中离线同步读取MaxCompute（ODPS）表数据时，如何同步分区字段？

DataWorks中离线同步读取MaxCompute（ODPS）表数据时，如何同步分区字段？

展开

收起

真的很搞笑 2023-06-26 14:00:26 287 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

飞云觅宙

十年摸盘键，代码未曾试。今日码示君，谁有上云事。

读取MaxCompute（ODPS）表数据时，想同步分区字段可以在字段映射处选择添加一行，输入分区列名，如分区列有pt等；

读取MaxCompuet（ODPS）表数据时，想同步多个分区数据，先读取数据所在的分区信息。 ODPS的分区配置支持linux shell通配符，*表示0个或多个字符，？表示任意一个字符。默认情况下，读取的分区必须存在，如果分区不存在则运行的任务会报错。如果您希望当分区不存在时任务仍然执行成功，则可以切换至脚本模式执行任务，并在ODPS的Parameter中添加"successOnNoPartition": true配置。

您还可以根据实际需求设置分区数据的获取条件（以下操作需要转脚本模式配置任务）：如果您需要指定最大分区，则可以添加/query/ ds=(select MAX(ds) from DataXODPSReaderPPR)配置信息。如果需要按条件过滤，则可以添加相关条件/query/ pt+表达式配置。例如/query/ pt>=20170101 and pt<20170110表示获取pt分区中，20170101日期之后（包含20170101日期），至20170110日期之前（不包含20170110日期）的所有数据。

说明 /query/表示将其后填写的内容识别为一个where条件。

2023-06-26 15:08:37

赞同 1 展开评论
芯在这

请在字段映射处选择添加一行，输入分区列明，如分区列有pt等； https://help.aliyun.com/document_detail/146663.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-06-26 14:03:54

赞同展开评论

问答分类：

分布式计算 DataWorks MaxCompute 云原生大数据计算服务 MaxCompute 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks同步大数据开发治理平台 DataWorks字段云原生大数据计算服务 MaxCompute odps 云原生大数据计算服务 MaxCompute分区大数据开发治理平台 DataWorks maxcompute

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

DataWorks手工方式开发覆写了生产表数据，然后去产出表的节点去执行下数据质量校验？

208

1

0

DataWorks有什么方法可以自动把新增字段的映射加上再同步任务？

453

1

0

DataWorks中odps sql里面里面执行了 drop分区操作？

193

1

0

dataworks一般就是数据整合完以后，通过查询sql 把temp表数据通过api共享出去吗？

238

2

0

dataworks离线任务，如何将定时任务和业务时间改成当日的？

410

13

0

DataWorks能否实现离线部署？

210

0

0

DataWorks新创建的离线同步任务，勾选了发布后生成实例，发布之后确实生成实例了怎么办？

256

12

0

dataworks 整库同步我需要同步多张表数据然后写入一张表这个有办法配置吗？

200

1

0

使用新版 dataworks同步数据，字段映射的时候没有办法选择分区字段？

197

1

0

DataWorks【数据地图】分区信息有记录，但是记录数都是-1是什么原因呢？

204

1

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

阿里云数据总线DataHub深度对接实战指南：从入门到生产级管道构建

阿里云服务器实例选择指南：经济型、通用型、计算型、内存型性能解析与场景解析

AutoMQ x 阿里云 OSS Tables：基于 Iceberg 构建流表一体的实时入湖

基于 DataWorks AI 助理备份实例日志到 OSS 文件系统

阿里云DataWorks数据同步与ETL处理完全指南：从数据集成到数据治理全链路解析

相关解决方案

更多

海量异构数据预处理破局之道

Agent 赋能企业数据治理

基于数据闪回，快速恢复数据

Tair 实现即时通信场景中的消息多端同步

多模态数据信息提取

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

大数据计算MaxCompute failed：odps-0110999怎么办？

在大数据计算MaxCompute怎么将字符串日期快速转成timestamp类型？

在大数据计算MaxCompute中，这种多久能查询到？

关于优化AI交互策略的改进建议——基于用户分层实现工具价值与体验平衡

展开全部

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

大数据阿里云产品的简单介绍理解

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

【内含分享PPT/视频/文章】阿里云MVP学院MaxCompute技术闭门会线上首播 | 2019大数据技术公开课第二季

企业大数据平台下数仓建设思路

PyODPS DataFrame 处理笛卡尔积的几种方式

阿里云MaxCompute 2019-7月刊

MaxCompute上如何处理非结构化数据

展开全部

还有其他疑问?