各位老师，Flink CDC中我这个TM的堆内存占用怎么调小呢？现在没有跑任务，也占用了55%，这有

各位老师，Flink CDC中我这个TM的堆内存占用怎么调小呢？现在没有跑任务，也占用了55%，这有点不合理？

展开

收起

真的很搞笑 2023-07-02 16:47:10 241 版权

2 条回答

写回答

取消提交回答

Star时光
在 Flink CDC 中，堆内存占用主要来自以下两个方面：

1. Schema 初始化读取内存：Flink CDC 需要从数据库中读取表结构（Schema），这会占用一定的内存。您可以通过配置 table.scan.startup.timeout 参数来限制 Schema 读取时间，并缩短内存占用时间。

2. Flink 间歇性的 checkpoint 内存：当 Flink 进行 checkpoint 时，会占用一定的内存。您可以通过调整 checkpoint 策略来降低 checkpoint 的频率，从而减少内存使用。

为了减小 Flink CDC 的内存占用，您可以考虑以下几点优化：

- 优化 Schema 读取时间，限制内存使用时长：通过设置 table.scan.startup.timeout 参数来限制 Schema 初始化读取的时间。例如：
```
table.scan.startup.timeout = 60s
```
- 调整 checkpoint 策略，减少内存占用：可以减少 checkpoint 使用的内存个数，例如将并行的 checkpoint 数量设置为 2，降低 checkpoint 的频率：
```
execution.checkpointing.limit.num-checkpoints = 2
execution.checkpointing.interval = 5 minutes
```
- 针对特别大的表进行分流优化：对于特别大的表，可以考虑将其水平分流，将单张表拆分成多个子表，然后分别进行消费。

- 适当调大 TaskManager 的 JVM 内存使用：您可以适当增加 TaskManager 的 JVM 内存使用，例如增加到约 2GB。

通过以上优化措施，您应该能够减小 Flink CDC 的堆内存占用。请注意，具体的优化策略可能需要根据您的实际情况进行调整。
2023-07-30 12:56:09

赞同展开评论
算精通

北京阿里云ACE会长

在 Flink CDC 中,主要的内存占用主要来自以下两个方面:
Schema 初始化读取内存:Flink CDC 需要先从数据库读取表结构(Schema),会占用一定内存。可以配置 table.scan.startup.timeout 限制 Schema 读取时间,缩短占用时间。
Flink 间歇性 checkpoint 内存:Flink 在进行 checkpoint 时会占用一定内存。可以通过调整 checkpoint 策略,降低 checkpoint 频率来减少内存使用。
为了降低 Flink CDC 的内存使用,可以考虑以下几点:
优化 Schema 读取时间,限制内存使用时长
通过配置 table.scan.startup.timeout 参数,限制 Schema 初始化读取时间。例如:
properties
Copy
table.scan.startup.timeout = 60s
调整 checkpoint 策略,减少 checkpoint 内存占用
可以减少 checkpoint 使用的内存个数,例如将使用 2 个 checkpoint 并行,降低 checkpoint 频率:
properties
Copy
execution.checkpointing.limit.num-checkpoints = 2
execution.checkpointing.interval = 5 minutes
针对特别大的表,进行分流优化
对特别大表进行水平分流,将单张表分成多个子表,再分别消费。
适当调大 JVM 内存使用,避免频繁触发 Full GC
你可以适当增加 TaskManager JVM 内存使用,例如增加到 2G 左右。

2023-07-30 10:50:21

赞同展开评论

各位老师，Flink CDC中我这个TM的堆内存占用怎么调小呢？现在没有跑任务，也占用了55%，这有

实时计算 Flink

相关文章

热门讨论

热门文章