文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC里想问下flink sql里有什么有用的参数限制拉取大小吗？

Flink CDC里由于binlog日志太大我source tidb会内存溢出找的参数都没啥用想问下flink sql里有什么有用的参数限制拉取大小吗？

展开

收起

小小鹿鹿鹿 2024-02-06 19:54:04 187 版权

阿里云 AI 助理回答

在使用 Flink CDC 读取 TiDB 的 Binlog 数据时，如果遇到内存溢出（OOM）问题，通常是因为 Binlog 数据量过大或分片数据处理不当导致的。以下是一些有效的参数和优化建议，可以帮助限制拉取大小并缓解内存压力：

1. 调整增量快照分片大小

Flink CDC 在全量阶段会将表按照主键分成多个分片（chunk），并通过增量快照算法逐个读取分片数据。如果单个分片的数据量过大，可能会导致 TaskManager 内存溢出。可以通过以下参数调整分片大小：

scan.incremental.snapshot.chunk.size
该参数用于控制每个分片包含的数据条数。默认值为 8096，可以适当减小该值以减少单个分片的数据量。例如：
```
'scan.incremental.snapshot.chunk.size' = '4096'
```
注意：减小分片大小会增加分片数量，但能有效降低单次读取的内存占用。

2. 优化分片字段选择

对于有联合主键的表，默认使用主键中的第一个字段进行分片。如果该字段的值分布不均匀（例如大量数据集中在某些值上），可能导致某些分片数据量过大，从而引发 OOM。可以通过以下参数指定其他字段进行分片：

scan.incremental.snapshot.chunk.key-column
指定一个非空类型的字段作为分片字段。例如：
```
'scan.incremental.snapshot.chunk.key-column' = 'your_column_name'
```
重要提示：确保指定的字段具有较好的数据分布性，避免数据倾斜。

3. 增加 TaskManager 内存

如果分片数据量无法进一步减少，可以尝试增加 TaskManager 的堆内存以容纳更大的分片数据。在 Flink 配置中调整以下参数：

taskmanager.memory.process.size
增加 TaskManager 的总内存大小。例如：
```
taskmanager.memory.process.size: 4g
```
taskmanager.memory.task.heap.size
增加 TaskManager 的堆内存大小。例如：
```
taskmanager.memory.task.heap.size: 3g
```

4. 开启 Source 复用

当作业中包含多个 TiDB CDC 源表时，每个源表都会启动独立的 Binlog Client，这会显著增加数据库的压力和内存消耗。通过开启 Source 复用功能，可以合并相同配置的源表，减少 Binlog 连接数和内存占用。

启用 Source 复用
在 SQL 作业中添加以下配置：
```
SET 'table.optimizer.source-merge.enabled' = 'true';
```
注意事项： - 开启 Source 复用后，需要无状态启动作业。 - 在 VVR 8.0.8 和 8.0.9 版本中，还需额外设置：
```
SET 'sql-gateway.exec-plan.enabled' = 'false';
```
- 不建议将 pipeline.operator-chaining 设置为 false，否则会增加序列化和反序列化的开销。

5. 升级 Flink 引擎版本

在某些旧版本中（如 VVR 8.0.8 及之前版本），最后一个分片可能需要读取大量数据，容易导致 TaskManager OOM。建议升级到 VVR 8.0.9 或更高版本，以避免该问题。

6. 限制 Binlog 拉取范围

如果 Binlog 数据量过大，可以通过以下方式限制拉取范围，减少不必要的数据读取：

scan.startup.mode
指定启动模式，避免从最早位点（earliest-offset）开始读取。例如：
```
'scan.startup.mode' = 'latest-offset'
```
可选值： - earliest-offset：从最早位点开始读取。 - latest-offset：从最新位点开始读取。 - specific-offset：从指定位点开始读取。 - timestamp：从指定时间戳开始读取。
scan.incremental.snapshot.enabled
如果不需要全量数据，可以禁用增量快照功能，仅读取增量数据。例如：
```
'scan.incremental.snapshot.enabled' = 'false'
```

7. 监控和调优

在调整参数后，建议通过 Flink Web UI 监控作业的运行状态，重点关注以下指标： - TaskManager 的内存使用情况。 - 分片读取的进度和数据量。 - Binlog 拉取的速度和延迟。

如果问题仍未解决，可以结合具体场景进一步分析，例如检查是否有热点数据或数据倾斜问题。

通过以上方法，您可以有效限制 Flink CDC 拉取 TiDB Binlog 数据的大小，缓解内存溢出问题。如果仍有疑问，请提供更多上下文信息以便进一步分析。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

流计算 SQL 日志服务实时计算 Flink版

问答标签：

实时计算 Flink版CDC flink SQL 实时计算 Flink版SQL 实时计算 Flink版cdc sql SQL参数

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

阿里云国际站安全中心：日志检索攻击溯源实战

哔哩哔哩基于阿里云PolarDB与通义千问构建全域内容洞察新框架

通用Agent技能：5个开箱即用的业务自动化Skill

一个文件夹 + 一个Markdown文件 = 你的第一个Skill

Text-to-SQL进阶小工具-text2sql 智能查询小工具

Flink CDC里想问下flink sql里有什么有用的参数限制拉取大小吗？

1. 调整增量快照分片大小

2. 优化分片字段选择

3. 增加 TaskManager 内存

4. 开启 Source 复用

5. 升级 Flink 引擎版本

6. 限制 Binlog 拉取范围

7. 监控和调优

实时计算 Flink

相关文章

热门讨论

热门文章

Flink CDC里 想问下flink sql里有什么有用的参数限制拉取大小吗？

1. 调整增量快照分片大小

2. 优化分片字段选择

3. 增加 TaskManager 内存

4. 开启 Source 复用

5. 升级 Flink 引擎版本

6. 限制 Binlog 拉取范围

7. 监控和调优

实时计算 Flink

相关文章

热门讨论

热门文章

Flink CDC里想问下flink sql里有什么有用的参数限制拉取大小吗？