开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks DQC中SQL级别和任务级别的区分是什么?

DataWorks DQC中SQL级别和任务级别的区分是什么?

展开
收起
真的很搞笑 2023-07-30 16:28:01 53 0
2 条回答
写回答
取消 提交回答
  • 在DataWorks的数据质量中心(DQC),SQL级别和任务级别是两种不同的数据质量检测方式,用于对数据进行不同层次的质量检查。

    1. SQL级别:

      • SQL级别的数据质量检测是通过编写SQL语句来对数据进行筛选、聚合、计算等操作,并从中提取出关键的指标和异常情况。
      • 在SQL级别,您可以使用DataWorks DQC提供的内置函数和规则,或自定义SQL语句,对表里的数据进行质量检查。
      • 这种级别的检测更加灵活,可以根据具体需求编写复杂的SQL逻辑,但需要一定的SQL编程能力。
    2. 任务级别:

      • 任务级别的数据质量检测是通过配置预定义的数据质量规则来对数据进行检查。
      • 在任务级别,您可以选择已定义好的数据质量规则,例如字段值为空、数据重复等,将这些规则应用于目标表进行检测。
      • 这种级别的检测相对简单,主要基于预定义规则的匹配和判定,无需编写复杂的SQL语句。
    2023-07-31 13:39:20
    赞同 展开评论 打赏
  • DQC中SQL级别和任务级别的区分:
    sql级别:指多段sql,每段sql执行完毕后都会触发dqc执行校验;
    任务级别:任务级别会等待整个任务的多段sql执行全部完毕,再统一校验。如果配置了任务级别的分区表达式,触发的时候是不通过匹配逻辑的(匹配逻辑:分区表达式根据调度传过来的bizdate做替换计算,得到的结果跟调度实际传过来的分区表达式做匹配,如果一致则用这个分区表达式下的规则校验,不匹配则不校验),任务级别直接用bizdate替换掉分区表达式得到结果,这个结果作为实际校验的分区,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-30 16:44:17
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    SQL Server 2017 立即下载
    GeoMesa on Spark SQL 立即下载
    原生SQL on Hadoop引擎- Apache HAWQ 2.x最新技术解密malili 立即下载