开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

我用运行flink sql作业:flink kafka conector->hudi->hive,对

我用运行flink sql作业:flink kafka conector->hudi->hive,对于同一个topic里的数据,为何多次启动这个flink作业,最后hive count出来的数据条数每次都不一样(少于topic里的实际数据量)?

展开
收起
爱喝咖啡嘿 2023-01-03 14:50:33 192 0
1 条回答
写回答
取消 提交回答
  • 估计是中间有啥脏数据吧,可以一一排查下——该回答整理自钉群“Flink CDC 社区”

    2023-01-06 11:17:00
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Hive Bucketing in Apache Spark 立即下载
    spark替代HIVE实现ETL作业 立即下载
    2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载