DataWorks百问百答67:odps如何同步多个分区(附ODPS写插件指定分区技巧)?

本文涉及的产品
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: 同步odps分区配置

odps通配符配置

  • ODPS分区配置支持linux shell通配符,* 表示0个或多个字符,? 代表任意一个字符。

odps如何同步多个分区
例如分区表 test存在 pt=1,ds=hangzhou pt=1,ds=shanghai pt=2,ds=hangzhou pt=2,ds=beijing 四个分区,

  • 如果你想读取 pt=1,ds=shanghai 这个分区的数据,分区信息中配置: pt=1,ds=shanghai;
  • 如果你想读取 pt=1下的所有分区,分区信息中配置 :pt=1,ds=*;
  • 如果你想读取整个 test 表的所有分区的数据,分区信息中配置 :pt=,ds=
  • 如果需要指定最大分区,可以配置如下信息:

/query/ ds=(select MAX(ds) from DataXODPSReaderPPR)

  • 如果需要按条件过滤,可以配置如下信息:

/query/ pt>=20170101 and pt<20170110,表示pt分区大于等于20170101且小于20170110的所有数据

ODPS写插件指定分区技巧

  • 需要写入数据表的分区信息,必须指定到最后一级分区。把数据写入一个三级分区表,必须配置到最后一级分区

例如:pt=20150101/type=1/biz=2

  • 不支持写入多个分区

DataWorks百问百答历史记录 请点击这里查看>>

更多DataWorks技术和产品信息,欢迎加入【DataWorks钉钉交流群】

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
存储 SQL 分布式计算
大数据散列分区映射到分区
大数据散列分区映射到分区
176 4
|
存储 负载均衡 算法
大数据散列分区计算哈希值
大数据散列分区计算哈希值
190 4
|
大数据 数据管理 定位技术
大数据散列分区选择分区键
大数据散列分区选择分区键
149 2
|
8月前
|
DataWorks 关系型数据库 Serverless
DataWorks数据集成同步至Hologres能力介绍
本文由DataWorks PD王喆分享,介绍DataWorks数据集成同步至Hologres的能力。DataWorks提供低成本、高效率的全场景数据同步方案,支持离线与实时同步。通过Serverless资源组,实现灵活付费与动态扩缩容,提升隔离性和安全性。文章还详细演示了MySQL和ClickHouse整库同步至Hologres的过程。
|
10月前
|
DataWorks 关系型数据库 Serverless
DataWorks数据集成同步至Hologres能力介绍
本次分享的主题是DataWorks数据集成同步至Hologres能力,由计算平台的产品经理喆别(王喆)分享。介绍DataWorks将数据集成并同步到Hologres的能力。DataWorks数据集成是一款低成本、高效率、全场景覆盖的产品。当我们面向数据库级别,向Hologres进行同步时,能够实现简单且快速的同步设置。目前仅需配置一个任务,就能迅速地将一个数据库实例内的所有库表一并传输到Hologres中。
253 12
|
负载均衡 大数据
大数据散列分区查询频率
大数据散列分区查询频率
139 5
|
存储 大数据 数据处理
大数据散列分区数据分布
大数据散列分区数据分布
136 2
|
存储 负载均衡 监控
大数据散列分区数据分布
大数据散列分区数据分布
171 1
|
10月前
|
DataWorks 监控 数据建模
DataWorks产品体验评测
DataWorks产品体验评测
|
10月前
|
分布式计算 DataWorks 搜索推荐
DataWorks 产品评测与最佳实践探索!
DataWorks 是阿里巴巴推出的一站式智能大数据开发治理平台,内置15年实践经验,集成多种大数据与AI服务。本文通过实际使用角度,探讨其优势、潜力及改进建议。评测涵盖用户画像分析、数据治理、功能表现等方面,适合数字化转型企业参考。
247 1

相关产品

  • 大数据开发治理平台 DataWorks
  • 下一篇
    oss云网关配置