DataWorks如何配置MaxCompute监控配置分区表达式？

展开

收起

真的很搞笑 2023-09-25 10:01:29 246 版权

2 条回答

写回答

取消提交回答

芯在这

数据质量通过分区表达式来确定需要配置的规则：如果您的检查对象为非分区表，可以配置分区表达式为NOTAPARTITIONTABLE。如果您的检查对象为分区表，可以配置为业务日期的表达式（例如$[yyyymmdd]），也可以配置为正则表达式。在数据表的监控规则页面，单击分区表达式后的+，添加分区表达式。您可以选择新建分区表达式，也可以选择推荐的分区表达式：新建分区的表达式在添加分区对话框中，您可以根据自身需求编辑符合语法的分区表达式。非分区表可以直接选择推荐的分区表达式中的NOTAPARTITIONTABLE。一级分区的表达式格式：分区名=分区值，分区值可以是固定值，也可以是内置参数表达式。分区表必须配置到最后一级分区。多级分区表达式格式：1级分区名=分区值/2级分区名=分区值/N级分区名=分区值，分区值可以是固定值，也可以是内置参数表达式。参数必须使用中括号表示，例如$[yyyymmdd-N]。分区表达式周期由配置的业务日期决定，例如配置运行时间为前5天，则周期为每5天调度一次。支持的分区表达式如下表所示。分区表达式描述
dt=$[yyyymmdd-N] 代表前N天
dt=$[yyyymm01-1] 代表每月1日
dt=$[yyyymm01-Nm] 代表N月前1日
dt=$[yyyymmld-1] 代表每月最后一天
dt=$[yyyymmld-1m] 代表N月前最后一天
dt=$[hh24miss-1/24] 代表一个小时前
dt=$[hh24miss-30/24/60] 代表半个小时前
$[yyyymmdd] 调度日期
$[yyyymmdd-1] 格式为yyyymmddmiss-1，默认为当前实例运行的业务日期的前一天。
$[yyyymmddhh24miss] 格式为yyyymmddhh24miss，当前实例运行的业务日期：
NOTAPARTITIONTABLE 非分区表可以选择该分区表达式推荐的分区表达式下文将以分区名dt为例，为您介绍推荐的分区表达式。动态分区表建议使用包括正则的分区表达式。在添加分区对话框中，单击输入表达式的窗口，会显示数据质量为您推荐的分区表达式：如果有符合预
https://help.aliyun.com/document_detail/73690.html

，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-09-25 14:51:26

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在DataWorks中配置MaxCompute监控时，可以使用分区表达式来指定要监控的分区。分区表达式可以根据需要选择特定的分区进行监控，而不必监控整个表。

以下是在DataWorks中配置MaxCompute监控的步骤：
1. 登录DataWorks控制台并进入项目空间。
2. 在左侧导航栏中选择“运维中心”。
3. 在运维中心页面上方的工具栏中，选择“数据集成监控”。
4. 在数据集成监控页面，点击“新建监控任务”按钮。
5. 在弹出的对话框中，选择要监控的MaxCompute表。
6. 在“高级设置”部分，找到“分区表达式”字段，并填写适当的分区表达式。你可以使用MaxCompute的分区语法来指定要监控的特定分区。
例如，如果你的表按照日期进行了分区，可以使用如下的分区表达式来监控最近7天的数据：
```
ds >= '${yyyymmdd-7}'
```
这个表达式表示监控分区键（这里是"ds"）大于等于7天前的日期。

需要注意的是，分区表达式的具体语法和格式取决于你实际使用的分区方式和字段。确保使用正确的分区表达式以满足你的需求。
2023-09-25 13:40:58

赞同展开评论

DataWorks如何配置MaxCompute监控配置分区表达式？

大数据计算 MaxCompute

相关文章

热门讨论

热门文章