开发者社区> 问答> 正文

DataWork中离线系统定义分区表达式的目的是什么?

DataWork中离线系统定义分区表达式的目的是什么?

展开
收起
游客szyg5ww7yqnwy 2021-12-12 10:14:43 635 0
1 条回答
写回答
取消 提交回答
  • DataWork中离线质量校验:离线校验是在图形化界面上的。以MaxCompute表数据监控为例,首先选择一张表,然后定义一个特殊对象值,叫分区表达式。在离线系统里,数据都会分次写到不同的分区当中,大部分情况下分区与时间或业务日期有关联,因此最新的数据一般只会写到最新的分区中,定义分区表达式的目的就是为了限定质量监控范围。,这样每次只扫描最新分区就可以了。

    2021-12-12 10:15:13
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Phoenix 全局索引原理与实践 立即下载
MaxCompute2.0外表对接异构存储源和支持非结构化数据介绍 立即下载
实战-如何基于HBase构建图片视频数据的统一存储检索方案 立即下载