文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 文章正文

DataWorks百问百答33：数据同步怎么配置ODPS分区？

2020-06-19 2960

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 数据同步怎么配置ODPS分区

同步任务可以支持ODPS的数据列、分区列、常量列，但_不支持函数列_

ODPS分区配置支持linux shell通配符，* 表示0个或多个字符，? 代表任意一个字符

默认情况下，读取的分区需要存在，如果分区不存在任务会报错。如果您希望分区不存在时任务仍然成功，您可以转换为脚本模式，在odps的parameter端下面配置successOnNoPartition参数，即 "successOnNoPartition": true

例如：分区表 test存在 pt=1,ds=hangzhou pt=1,ds=shanghai pt=2,ds=hangzhou pt=2,ds=beijing 四个分区，如果你想读取 pt=1,ds=shanghai 这个分区的数据，分区信息中配置: pt=1,ds=shanghai；

如果你想读取 pt=1下的所有分区，分区信息中配置 :pt=1,ds=；如果你想读取整个 test 表的所有分区的数据，分区信息中配置 :pt=,ds=*

如果需要指定最大分区，可以配置如下信息：

/*query*/ ds=(select MAX(ds) from DataXODPSReaderPPR)

如果需要按条件过滤，可以配置如下信息：

/*query*/ pt>=20170101 and pt<20170110，表示pt分区大于等于20170101且小于20170110的所有数据

ODPS写插件指定分区技巧

需要写入数据表的分区信息，必须指定到最后一级分区。把数据写入一个三级分区表，必须配置到最后一级分区

例如：pt=20150101/type＝1/biz=2

不支持写入多个分区

DataWorks百问百答历史记录 请点击这里查看>>

更多DataWorks技术和产品信息，欢迎加入【DataWorks钉钉交流群】

文章标签：

大数据开发治理平台 DataWorks

云原生大数据计算服务 MaxCompute

Shell

分布式计算

Linux

MaxCompute

DataWorks

关键词：

云原生大数据计算服务 MaxCompute dataworks

云原生大数据计算服务 MaxCompute分区

大数据开发治理平台 DataWorks配置

大数据开发治理平台 DataWorks odps

数据同步云原生大数据计算服务 MaxCompute

相关实践学习

基于Hologres轻量实时的高性能OLAP分析

本教程基于GitHub Archive公开数据集，通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析，同时使用DataV内置模板，快速搭建实时可视化数据大屏，从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。

zaid胡振宇

目录

相关文章

游客j3yleqdz7cbla

|

分布式计算 DataWorks 调度

oss数据同步maxcompute报错

在使用阿里云DataWorks同步OSS数据至MaxCompute时，遇到“Input is not in the .gz format”的报错。问题源于目标目录中存在一个空文件，导致同步时识别错误。

游客j3yleqdz7cbla

760 14 14

青云交（Java大数据AI云原生Python）

|

12月前

|

存储搜索推荐算法

Java 大视界 -- Java 大数据在智能金融理财产品风险评估与个性化配置中的应用（195）

本文深入探讨了Java大数据技术在智能金融理财产品风险评估与个性化配置中的关键应用。通过高效的数据采集、存储与分析，Java大数据技术助力金融机构实现精准风险评估与个性化推荐，提升投资收益并降低风险。

青云交（Java大数据AI云原生Python）

530 0 0

Java 大视界 -- Java 大数据在智能金融理财产品风险评估与个性化配置中的应用（195）

武子康

|

分布式计算资源调度大数据

大数据-110 Flink 安装部署下载解压配置 Standalone模式启动打包依赖（一）

大数据-110 Flink 安装部署下载解压配置 Standalone模式启动打包依赖（一）

武子康

496 0 0

武子康

|

分布式计算资源调度大数据

大数据-110 Flink 安装部署下载解压配置 Standalone模式启动打包依赖（二）

大数据-110 Flink 安装部署下载解压配置 Standalone模式启动打包依赖（二）

武子康

384 0 0

武子康

|

消息中间件监控 Ubuntu

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

武子康

553 3 3

大数据-54 Kafka 安装配置环境变量配置启动服务 Ubuntu配置 ZooKeeper

武子康

|

存储分布式计算 druid

大数据-152 Apache Druid 集群模式配置启动【下篇】超详细！（一）

大数据-152 Apache Druid 集群模式配置启动【下篇】超详细！（一）

武子康

394 1 1

大数据-152 Apache Druid 集群模式配置启动【下篇】超详细！（一）

武子康

|

XML 分布式计算资源调度

大数据-02-Hadoop集群 XML配置超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece（一）

大数据-02-Hadoop集群 XML配置超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece（一）

武子康

686 5 5

武子康

|

XML 资源调度网络协议

大数据-02-Hadoop集群 XML配置超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece（二）

大数据-02-Hadoop集群 XML配置超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece（二）

武子康

762 5 5

武子康

|

分布式计算资源调度 Hadoop

大数据-01-基础环境搭建超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece

大数据-01-基础环境搭建超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece

武子康

491 4 4

大数据与机器学习

大数据开发治理DataWorks

热门文章

最新文章

云上一指禅：大数据产品DataWorks每日问答

DataWorks AI助理：在钉钉让AI助理帮你盯任务、修问题

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

【全新系列】DataWorks百问百答

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks产品使用合集之如何访问周期任务运维

DataWorks售前咨询

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

基于OCR的水位检测项目水位识别

DataWorks Data Agent：一句话搞定数据开发，让周期从天级到分钟级

拒绝“数据断层”：高质量舆情分析背后的隐形功臣——动态节点池

哪些政策要求企业开展漏洞扫描？

【赵渝强老师】阿里云大数据集成开发平台DataWorks

数据开发再提速！DataWorks正式接入Qwen3-Coder

DataWorks 千万级任务调度与全链路集成开发治理赋能智能驾驶技术突破

使用sql转换身份证15位-18位

使用DataWorks PyODPS节点调用XGBoost算法

DataWorks x 婚礼纪：智能一站式数据开发治理平台让千万新人的幸福时刻“数智化”

相关产品

大数据开发治理平台 DataWorks

文档详情产品详情

相关课程

更多

大数据知识图谱—钱大妈数据中台建设最佳实践

大数据知识图谱—数据中台的智能进化—阿里巴巴十二年数据平台发展历程

大数据知识图谱—一文读懂云原生一体化数仓

如何将 PolarDB-X 与大数据等系统互通

一站式大数据开发治理平台DataWorks初级课程

DataWorks一站式大数据开发治理平台精品课程

相关电子书

更多

DataWorks全链路数据质量解决方案-2020飞天大数据平台实战应用第一季

基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季

MaxCompute技术公开课第四季之如何将Kafka数据同步至MaxCompute

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！