备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC中这个问题什么原因？

Flink CDC中这个问题什么原因？
PostgreSQL(10.0) replication slot消费完后restart_lsn不变导致PG的WAL日志不被清理。（https://github.com/ververica/flink-cdc-connectors/issues/106）
目前我们排查的情况如下：
1、最开始以为是因为没有数据更新导致，所以按说明增加了对应的心跳表；
2、现在是数据能正常同步到HUDI；
3、心跳表中的数据也是正常的在更新。
4、Restrar_lsn就是不变，导致日志积压。

展开

收起

十一0204 2023-08-09 08:03:22 126 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

根据你提供的信息，这个问题是由于 PostgreSQL replication slot 的 restart_lsn 不变导致 PG 的 WAL 日志没有被清理而引起的。这个问题的具体原因可能有多种可能性，以下是一些可能导致该情况的原因：

Flink CDC 配置问题：检查 Flink CDC 的配置是否正确，特别是涉及到 PostgreSQL replication slot 的相关配置项。确保配置中指定了正确的 replication slot 名称，并且 Flink CDC 正确地监测和更新 replication slot 的状态。

PostgreSQL 配置问题：检查 PostgreSQL 数据库的配置，确保已启用 WAL 日志和适当的日志清理策略。确保 replication slot 的配置和管理是正确的，并且数据更新操作会触发 WAL 日志的生成和清理。

数据库连接问题：确保 Flink CDC 和 PostgreSQL 之间的连接是稳定的，并且没有异常断开或重连的情况。检查网络连接、防火墙设置以及连接池配置等因素，确保连接的可靠性和稳定性。

PostgreSQL 版本兼容性：确认你使用的 Flink CDC 版本是否与 PostgreSQL 10.0 兼容，并且支持对应版本的 replication slot 功能。有时，特定版本的 Flink CDC 可能存在与某些 PostgreSQL 版本的兼容性问题，导致出现不正常的行为。

2023-08-13 17:39:59

赞同展开评论
意中人jswy

意中人就是我呀！

这问题已经解决了啊对于业务很空闲但是数据需要同步的库，可以自定义脚本，定期更新无用表，手工推进lsn。此回答整理至钉群“Flink CDC 社区”。

2023-08-09 11:55:41

赞同展开评论

问答分类：

关系型数据库流计算 PostgreSQL 实时计算 Flink版日志服务云原生数据库 PolarDB

问答标签：

实时计算 Flink版CDC

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2077

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1204

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1225

2

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

850

1

0

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

1951

3

0

flink cdc 怎么做断点续传啊

6252

6

0

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

1403

5

0

请教下有flink cdc 对接mysql5.6的demo么？我这边显示各种包错误

1168

4

0

flink cdc支持国产数据库吗？

951

0

0

大佬们，flink cdc如何限制拉取的数量？flink内存不多

2202

6

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

Healenium Java使用手册

Mysql基础学习day02-作业

【微电网】【创新点】基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度研究(Matlab代码实现)

使用数据连接池进行数据库操作

flywa报错java.sql.SQLSyntaxErrorException: Unknown database ‘flyway‘

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

请问如何用flink sql客户端用yarn application模式提交任务呢？

请问下大家有没有遇到过这个错:Caused by: java.lang.ClassNotFoundE

flink-CDC-3.0 mysql to doris 数据同步任务经常报错

在斗鱼，实时计算发展的历程如何？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink-CDC 文档网站地址是什么？

flink的1cu是指1cpu还是1cpu+4g存储？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

在Flink CDC中ogg可以做实时同步吗？

展开全部

阿里云实时计算产品案例&解决方案汇总

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

基于Flink的实时日志分析系统实践

使用 Kafka 和 Flink 构建实时数据处理系统

Flink: 快速构建统一的实时日志平台

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

Flink SQL 功能解密系列 —— 解决热点问题的大杀器MiniBatch

Apache Flink 零基础入门（三）：DataStream API 编程

如何分析及处理 Flink 反压？

Apache Flink 进阶（八）：详解 Metrics 原理与实战

展开全部

还有其他疑问?