DataWorks数据集成holo的时候主键冲突导致少数据

已解决

DataWorks数据集成holo的时候主键冲突导致少数据

展开
收起
阿里云服务支持 2022-12-09 15:04:53 230 分享 版权
1 条回答
写回答
取消 提交回答
  • 推荐回答
    官方回答

    源表和目标表的主键不一样。用户任务上设置的写holo的conflictMode是ignore,也就是数据在写入holo的时候主键冲突,数据会忽略掉 不写入。

    源端的数据用目标端的pk去group by查询一下count,源端表查询select count(*) from (select xxxxx from xxx group by xxx) ,然后源端的数据数量,要用目标端的pk去重再统计,统计出来的才是会写入目标端的数量。(因为目标端配了冲突就丢弃)。

    image.png

    image.png

    2022-12-09 15:17:02
    赞同 展开评论

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

收录在圈子:
作为全球云计算的领先者,阿里云为全球230万企业提供着云计算服务,服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务,给用户带来极速愉悦的服务体验。
还有其他疑问?
咨询AI助理