DataWorks中odps sql 任务这个参数和 partition 里该怎么填？

展开

收起

真的很搞笑 2023-11-13 11:57:31 590 版权

4 条回答

写回答

取消提交回答

sunrr

在DataWorks的Odps SQL任务中，partition参数是用来配置分区信息的。如果你需要读取整个表的所有分区的数据，可以将partition参数配置为"partition":"pt=,ds="。

此外，你还可以根据实际需求设置分区数据的获取条件。例如，如果你需要指定最大的分区，可以添加"/query/ ds= (select MAX (ds) from DataXODPSReaderPPR)"配置信息。如果需要按条件过滤，可以添加相关条件的/query/ pt+表达式配置。例如，"/query/ pt>=20170101 and pt<20170110"表示获取pt分区中，20170101日期之后（包含20170101日期），至20170110日期之前（不包含20170110日期）的所有数据。

总的来说，你需要根据你的实际需求和数据分布来合理配置partition参数。

2023-11-30 16:36:11

赞同展开评论
Star时光
在DataWorks中ODPS SQL任务参数填写时，请参照以下格式：--param <param_name>=<param_value> --partition <partition_name>=<partition_value>
这里的 <param_name> 是自定义参数名称， <param_value> 是与该参数相对应的值； <partition_name> 是分区名称， <partition_value> 是该分区对应的值。
举例来说，假设我们有一个名为 test_table 的表，并且我们想要查询其中的一个分区 dt=20210101 ，则参数填写如下：
```
--param name1=value1 --partition dt=20210101
```
注意，在运行ODPS SQL任务前，务必确保所填入的分区值存在于ODPS表中。
2023-11-13 22:02:07

赞同展开评论
芯在这

where 读 like "202311%" ； insert写入 202311 ，日期用调度参数代替配置为月调度任务，可以模糊匹配过滤出202311xx分区的数据然后写入到202311的分区其中202311可以用调度参数来做替换
配置 arg=$[yyyymm]
调用 ${arg}，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-11-13 16:18:44

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在DataWorks中，ODPS SQL任务中的一些参数和分区信息需要根据具体的业务需求来填写。以下是一些常见的参数和分区示例：
1. 参数设置：您可以填写一些自定义参数供ODPS SQL任务使用。例如，您可以填写一个自定义参数 bizdate ，并在ODPS SQL中使用该参数作为动态参数。请参阅《DataWorks V2.0 ODPS SQL任务》以获取更多详细信息。
2. 分区设置：您可以根据业务需求创建ODPS表的分区。例如，您可以为表创建一个名为date的分区，其中包含每日的数据。请参阅《ODPS SQL大全》以获取更多详细信息。
2023-11-13 13:37:32

赞同展开评论

DataWorks中odps sql 任务这个参数和 partition 里该怎么填？

大数据开发治理DataWorks

相关文章

相关解决方案

热门讨论

热门文章

DataWorks中odps sql 任务 这个参数和 partition 里该怎么填？

大数据开发治理DataWorks

相关文章

相关解决方案

热门讨论

热门文章

DataWorks中odps sql 任务这个参数和 partition 里该怎么填？