开发者社区 > 大数据与机器学习 > 正文

阿里云E-MapReduce clickhouse消费kafka的数据 kafka发生重启 ?

阿里云E-MapReduce clickhouse消费kafka的数据 kafka发生重启 clickhouse消费可能丢数据 有啥参数可以配置? 各位大神有遇到吗

展开
收起
真的很搞笑 2023-07-13 15:01:42 112 0
1 条回答
写回答
取消 提交回答
  • 阿里云 E-MapReduce 的 ClickHouse 通过 Kafka 消费数据时,如果 Kafka 发生重启,可能会导致 ClickHouse 无法继续消费数据。以下是两种解决方法:

    使用 Kafka 的副本机制。当 Kafka 发生重启时,副本可以继续提供数据服务,这样 ClickHouse 就可以继续消费数据。
    在 ClickHouse 中配置 KafkaConsumer.auto.offset.reset 参数为 earliest。这样,ClickHouse 会自动从 Kafka 最早的 offset 开始消费数据,不会因为 Kafka 重启而丢失数据。
    希望以上内容对您有所帮助。

    2023-09-28 10:55:36
    赞同 展开评论 打赏

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

相关产品

  • 开源大数据平台 E-MapReduce
  • 相关电子书

    更多
    MaxCompute技术公开课第四季 之 如何将Kafka数据同步至MaxCompute 立即下载
    ClickHouse在手淘流量分析应用实践Jason Xu 立即下载
    云数据库clickhouse最佳实践 立即下载