文档备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 正文

DataWorks中离线同步读取MaxCompute（ODPS）表数据时，如何同步分区字段？

DataWorks中离线同步读取MaxCompute（ODPS）表数据时，如何同步分区字段？

展开

收起

真的很搞笑 2023-06-26 14:00:26 287 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

飞云觅宙

十年摸盘键，代码未曾试。今日码示君，谁有上云事。

读取MaxCompute（ODPS）表数据时，想同步分区字段可以在字段映射处选择添加一行，输入分区列名，如分区列有pt等；

读取MaxCompuet（ODPS）表数据时，想同步多个分区数据，先读取数据所在的分区信息。 ODPS的分区配置支持linux shell通配符，*表示0个或多个字符，？表示任意一个字符。默认情况下，读取的分区必须存在，如果分区不存在则运行的任务会报错。如果您希望当分区不存在时任务仍然执行成功，则可以切换至脚本模式执行任务，并在ODPS的Parameter中添加"successOnNoPartition": true配置。

您还可以根据实际需求设置分区数据的获取条件（以下操作需要转脚本模式配置任务）：如果您需要指定最大分区，则可以添加/query/ ds=(select MAX(ds) from DataXODPSReaderPPR)配置信息。如果需要按条件过滤，则可以添加相关条件/query/ pt+表达式配置。例如/query/ pt>=20170101 and pt<20170110表示获取pt分区中，20170101日期之后（包含20170101日期），至20170110日期之前（不包含20170110日期）的所有数据。

说明 /query/表示将其后填写的内容识别为一个where条件。

2023-06-26 15:08:37

赞同 1 展开评论
芯在这

请在字段映射处选择添加一行，输入分区列明，如分区列有pt等； https://help.aliyun.com/document_detail/146663.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-06-26 14:03:54

赞同展开评论

问答分类：

分布式计算 DataWorks MaxCompute 云原生大数据计算服务 MaxCompute 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks同步大数据开发治理平台 DataWorks字段云原生大数据计算服务 MaxCompute odps 云原生大数据计算服务 MaxCompute分区大数据开发治理平台 DataWorks maxcompute

问答地址：

开发者社区 > 大数据与机器学习 > 大数据计算 MaxCompute > 问答

相关问答

在大数据计算MaxCompute中MaxCompute资源DataWorks资源组这两个分别在哪看?

231

2

0

DataWorks中odps java sdk 支持一次性执行多条sql吗？

416

1

0

DataWorks离线和实时任务是不能放在一个资源组里跑的吧？

193

1

0

DataWorks手工方式开发覆写了生产表数据，然后去产出表的节点去执行下数据质量校验？

208

1

0

DataWorks分区的数据，利用参数可以实现嘛？

250

1

0

DataWorks有什么方法可以自动把新增字段的映射加上再同步任务？

453

1

0

大数据计算MaxCompute中delete操作的数据，也会同步过来吗？

180

1

0

DataWorks创建一个指向MC某个项目的数据源，这个数据源有开发环境和生产环境，然后数仓开发人员

233

1

0

DataWorks中odps+flink数据同步，odps在数据地图上已经能看到分区了？

241

0

0

DataWorks数据源是有配置用户名和密码，PolarDB到mc，通过可视化没有报错？

199

0

0

大数据与机器学习

大数据计算 MaxCompute

MaxCompute（原ODPS）是一项面向分析的大数据计算服务，它以Serverless架构提供快速、全托管的在线数据仓库服务，消除传统数据平台在资源扩展性和弹性方面的限制，最小化用户运维投入，使您经济并高效的分析处理海量数据。

我要提问

相关文章

阿里云数据总线DataHub深度对接实战指南：从入门到生产级管道构建

阿里云服务器实例选择指南：经济型、通用型、计算型、内存型性能解析与场景解析

AutoMQ x 阿里云 OSS Tables：基于 Iceberg 构建流表一体的实时入湖

基于 DataWorks AI 助理备份实例日志到 OSS 文件系统

阿里云DataWorks数据同步与ETL处理完全指南：从数据集成到数据治理全链路解析

相关解决方案

更多

海量异构数据预处理破局之道

Agent 赋能企业数据治理

基于数据闪回，快速恢复数据

Tair 实现即时通信场景中的消息多端同步

分析 Agent 实现一键 AI 数据洞察

热门讨论

热门文章

ODPS 的下一个15年，大数据将迎来春天还是寒冬？

请问下大数据计算MaxCompute dataworks是否有全局变量？

大数据计算MaxCompute用kettle的转换功能去进行odps的同步数据可行吗？

大数据计算MaxCompute这种mapjoin构建hash table时间很长，有什么优化方向吗?

关于MaxCompute 中的CU为什么设置CPU和内存的比例是1:4

大数据计算MaxCompute该字段类型从tinyint改为Int,怎么修改?

大数据计算MaxCompute failed：odps-0110999怎么办？

在大数据计算MaxCompute怎么将字符串日期快速转成timestamp类型？

在大数据计算MaxCompute中，这种多久能查询到？

关于优化AI交互策略的改进建议——基于用户分层实现工具价值与体验平衡

展开全部

Python+大数据计算平台，PyODPS架构手把手教你搭建

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

混合云模式下 MaxCompute + Hadoop 混搭大数据架构实践

【内含分享PPT/视频/文章】阿里云MVP学院MaxCompute技术闭门会线上首播 | 2019大数据技术公开课第二季

企业大数据平台下数仓建设思路

阿里怎么发工资？自研薪酬管理系统首次曝光

10月18日，德国法兰克福，阿里云MaxCompute2.0，全面布局AI人工智能

MaxCompute常用语句汇总(更新ing)

深入阿里云大数据IDE–MaxCompute Studio

阿里云 MaxCompute 2020-4 月刊

展开全部

还有其他疑问?