开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

请问flinkcdc中,upser-kafka会一直存储在kafka里面,攒着内存那kafka不会?

问题1:请问flinkcdc中,upser-kafka会一直存储在kafka里面,攒着内存,那kafka不会吗?我就是在这个群里看到说用upsert-kafka的,要不我都不知道有这个。
问题2:删除topic管用吗?

展开
收起
小易01 2023-07-19 18:09:57 110 0
2 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    在 Flink CDC 中,使用 Upsert-Kafka SinkOperator 进行数据同步时,如果 Kafka 的消息队列(message queue)中积累了大量的数据,可能会导致 Kafka 的内存占用较高,从而影响 Kafka 的性能和稳定性。
    为了避免这种情况,可以通过调整 Kafka 的配置参数和增加 Kafka 的分区数等方式来优化 Kafka 的性能和扩展性。具体来说,可以采取以下措施:
    调整 Kafka 的内存限制参数。
    可以根据 Kafka 的实际内存使用情况,适当调整 Kafka 的内存限制参数,例如 max.heap.size、max.request.size 等参数,以避免内存溢出和性能下降。
    增加 Kafka 的分区数。
    可以根据数据量和负载情况,适当增加 Kafka 的分区数,以提高 Kafka 的并发处理能力和吞吐量。需要注意的是,增加分区数会带来一定的管理和维护成本,需要根据实际情况进行权衡和调整。
    设置消息 TTL 时间。

    2023-07-29 19:33:56
    赞同 展开评论 打赏
  • 意中人就是我呀!

    "回答1:普通kafka有默认消息保存时间,一般都设置7-15天之间或者达到阈值开始清理已经消费的数据。
    回答2:管用。
    此回答整理至钉群“Flink CDC 社区”。"

    2023-07-19 18:59:57
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关电子书

更多
Java Spring Boot开发实战系列课程【第16讲】:Spring Boot 2.0 实战Apache Kafka百万级高并发消息中间件与原理解析 立即下载
MaxCompute技术公开课第四季 之 如何将Kafka数据同步至MaxCompute 立即下载
消息队列kafka介绍 立即下载