备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC中我的flink-1.16.2版本出现这个问题这个怎么解决呢？

"Flink CDC中我的flink-1.16.2版本在使用sqlserver cdc 写 upsert-kafka的时候总是会oom。查看了堆dump,发现MemorySegment对象越来越多，感觉是没被完全回收，同时checkpoint数据包越来越大，从2M增加到200+M，最终oom，这个怎么解决呢？

我怀疑跟这个kafka包有关系。之前我用flink-1.13.6版本配套的cdc是没有问题的。两个版本用的同一个sqlserver-connector-2.3 ,只有kafka connector版本不一样，flink-1.16.2 能使用其他版本的 kafka-connector么？"

展开

收起

十一0204 2023-08-09 08:06:10 241 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

在使用 Flink CDC 将 SQL Server CDC 数据写入 Upsert-Kafka 时经常发生 OOM（Out of Memory）错误，并且堆转储（heap dump）显示 MemorySegment 对象数量不断增加，而且检查点（checkpoint）数据包越来越大，从2MB增加到200+MB，最终导致内存溢出。你想知道如何解决这个问题。

这个问题可能是由于以下几个原因导致的，你可以尝试以下解决方法：

调整 Flink 的任务并行度（parallelism）：检查你的 Flink 作业的任务并行度设置。如果并行度过高，可能会导致每个任务的内存使用量增加，从而导致 OOM。考虑降低任务并行度，以减少内存压力。

调整 Flink 的内存配置：检查你的 Flink 作业的内存配置，特别是任务管理器的堆内存大小 (taskmanager.heap.size) 和网络缓冲区的大小 (taskmanager.network.memory.min 和 taskmanager.network.memory.max)。根据你的实际情况，适当增加或减少内存配置，以平衡内存使用和性能。

调整 Flink 的状态后端配置：检查你的 Flink 作业的状态后端配置，特别是状态后端的类型（如 RocksDB）和相关的配置参数。使用持久化的状态后端可以减少内存占用，并将状态存储在磁盘上。根据你的需求和硬件资源，选择适当的状态后端类型和配置参数。

调整 Flink 的 Checkpoint 配置：检查你的 Flink 作业的检查点配置，特别是检查点的频率和保留策略。较高的检查点频率和较长的保留时间会增加内存和存储开销。根据你的数据更新频率和容错需求，调整检查点配置，以平衡内存和存储资源的使用。

检查代码中的资源泄漏：仔细检查你的代码，确保没有发生资源泄漏的情况。例如，在使用完资源后及时关闭连接、释放资源等。

升级 Flink 版本：如果可能，考虑升级到最新版本的 Flink，以获取已修复的 bug 和性能改进。

2023-08-13 17:40:01

赞同展开评论

问答分类：

消息中间件 Kafka 流计算实时计算 Flink版云消息队列 Kafka 版云数据库 RDS SQL Server 版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版版本实时计算 Flink版cdc版本实时计算 Flink版怎么解决实时计算 Flink版cdc flink-1.16.2

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC中oracle 出现这个问题，怎么解决？

126

1

0

我这边有个flink job周末一直在报GC频繁，然后oom ，然后连接异常，被判定失联，怎么解决？

510

2

0

Flink CDC里这个错误怎么解决？

107

1

0

Flink CDC写Oracle 一直报错缺失等号怎么解决？

327

4

0

Flink CDC报的这个错怎么解决，我看到issues也有人提但是没解决方案？

108

1

0

在Flink我配置的这种，报错了，怎么解决？

1023

3

0

Flink CDC这个怎么解决?

349

1

0

对于Flink CDC，报这个错，怎么解决呢？

140

0

0

Flink中mvn install flink源码时候报这个怎么解决啊？

124

0

0

Flink CDC里mysql中字段类型为json，这该怎么解决？

142

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

Flink + Fluss 实战: Delta Join 原理解析与操作指南

别让"我觉得"毁了架构：用这条指令让AI做你的技术选型审计员

数据一进门就要查身份证：聊聊数据接入的安全防护那点“真功夫”

Flink + Fluss 实战: Delta Join 原理解析与操作指南

定义 AI 时代消息引擎，ApacheRocketMQ 荣获 InfoQ“2025 AI 开源明星项目”

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

flink cdc source端能降低消费速度嘛？

flink cdc同步的源表，一定要有主键么？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

flink datastream ，向clickhouse插入数据时怎么关闭插入时更新,

请问一下Flink mysqlcdc获取到数据之后关联结果不更新这个怎么办?

Flink CDC有知道Mac m1下的docker 环境如何开启sqlserver代理吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

为什么说流处理即未来？

展开全部

还有其他疑问?