开发者社区 问答 正文

小米手机激活数仓的实时链路中,如何保证数据的去重和准确性?

小米手机激活数仓的实时链路中,如何保证数据的去重和准确性?

展开
收起
不吃核桃 2024-08-19 14:45:01 58 发布于山西 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 小米手机激活数仓的实时链路中,使用HBase来保存历史的全量ID以进行去重。在处理过程中,通过异步join方式将实时数据与HBase中的历史数据进行关联,以判断数据是否已存在,从而确保数据的去重和准确性。
    image.png
    image.png
    image.png

    2024-08-19 19:57:56 举报
    赞同 8 评论

    评论

    全部评论 (0)

    登录后可评论