Flink CDC有没有用mongocdc同步一个大collection?

Flink CDC有没有用mongocdc同步一个大collection碰到taskmanager oom的?
尝试过数据不落地,只是按分钟count一下条数,仍然会oom。
collection有百亿数据,起了75个10c32g的taskmanager,还是会在半到一个小时内oom,峰值拉取能到2kw/分钟,做checkpoint时候降到一两百万/分钟,后面oom了就跑不下去了,频繁拉起新taskmanager停老的?版本 flink 1.17 cdc 2.4.1,用的mongodb incremental connector?2000万每分钟拉过来也要一天,再慢就满足不了业务需求了。存量数据两百多亿,每天10%更新

展开
收起
真的很搞笑 2023-09-27 07:55:59 105 分享 版权
1 条回答
写回答
取消 提交回答
  • 控制一下拉取数据的速度呢,你这个也太大了,此回答整理自钉群“Flink CDC 社区”

    2023-09-27 14:57:18
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

还有其他疑问?
咨询AI助理