开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks配置监控,如何对比两张表的计算结果是否相同呢?

DataWorks配置监控,如何对比两张表的计算结果是否相同呢?绝对值对比那里固定值只能填写一个具体的数值,不可以再配置一条sql?

展开
收起
真的很搞笑 2023-11-13 11:32:18 55 0
3 条回答
写回答
取消 提交回答
  • 在DataWorks中,如果你想对比两张表的计算结果是否相同,你可以使用"绝对值对比"功能。但是,这个功能只支持比较两个固定值,不支持比较两条SQL语句的结果。

    如果你想要比较两条SQL语句的结果,你可能需要使用自定义的脚本任务或者Python任务来实现。你可以在这些任务中编写Python代码或者Shell脚本,来比较两张表的计算结果。

    以下是一个简单的Python代码示例,用于比较两张表的计算结果:

    import pandas as pd
    
    # 读取两张表的数据
    table1_data = pd.read_csv('table1.csv')
    table2_data = pd.read_csv('table2.csv')
    
    # 比较两张表的数据
    if table1_data.equals(table2_data):
        print("The results of the two tables are the same.")
    else:
        print("The results of the two tables are different.")
    
    2023-11-30 16:55:19
    赞同 展开评论 打赏
  • 目前还不支持数据比对哈 ,如果只返回一个值 那可以考虑在自定义sql里完成判断 sql返回0和1 再和固定值比对之类的方式 不是标准用法 可以试试,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-11-13 16:05:51
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在DataWorks配置监控规则时,确实可以比较两张表的计算结果是否相同。要进行这种比较,您需要创建一个监控规则,然后选择相应的数据质量插件(例如,值相同性插件)。在该插件的配置界面中,您需要指定两个要比较的字段及其相对应的表名,然后设置阈值(即允许的最大差异值)以及错误类型(例如,绝对值或百分比)。
    至于绝对值对比固定值的问题,目前DataWorks确实只允许您填写一个具体的数值作为阈值,而不能直接配置SQL语句来获取阈值。如果您想动态地获取阈值,可以通过在DataWorks之外的地方编写脚本或程序,获取阈值后再将其传递给DataWorks的方式实现

    2023-11-13 14:09:06
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载