备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

flinkcdc 读取postgresql数据，只能读到存量数据，不能读到增量数据，这是哪里的问题？

flinkcdc 读取postgresql数据，只能读到存量数据，不能读到增量数据，这是哪里的问题？

展开

收起

wenti 2023-02-13 14:50:22 336 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

清风拂袖

当 Flink CDC 只能读取 PostgreSQL 的存量数据而无法读取增量数据时，可能是以下原因造成的：

PostgreSQL 配置不正确：

确保已在 PostgreSQL 中启用了逻辑复制。您可以在 postgresql.conf 文件中通过设置 wal_level 为 logical 来启用它。此外，确保已创建复制槽并授予 Flink 用户复制权限。

Flink CDC 配置不正确：

检查 Flink CDC 源配置是否正确，包括数据库、表和启动偏移量。确保已将启动偏移量配置为 INITIAL 以从头开始读取数据。

防火墙或网络问题：

确保 Flink CDC 进程可以访问 PostgreSQL 数据库。检查防火墙设置并确保已允许 Flink 进程与 PostgreSQL 服务器通信。

PostgreSQL 复制滞后：

如果 PostgreSQL 复制滞后，Flink CDC 可能无法及时读取增量数据。尝试减少 PostgreSQL 复制滞后或增加 Flink CDC 的并行度以加快读取速度。

Flink 作业故障：

如果 Flink 作业遇到故障，它可能会丢失读取增量数据的偏移量。尝试重新启动 Flink 作业并检查日志以获取有关故障的更多信息。

PostgreSQL 数据类型不兼容：

确保 PostgreSQL 表中的数据类型与 Flink CDC 中声明的数据类型兼容。不兼容的数据类型可能会导致 Flink CDC 无法正确读取数据。

其他注意事项：

使用最新的 Flink 和 PostgreSQL 版本。
检查 Flink CDC 日志以获取有关错误的更多信息。
尝试使用不同的 Flink CDC 连接器，例如 Debezium PostgreSQL Connector。

2024-02-26 16:27:29

赞同展开评论

问答分类：

关系型数据库 PostgreSQL 云原生数据库 PolarDB 实时计算 Flink版

问答标签：

flinkcdc云数据库 RDS MySQL 版数据增量

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

flink1.13.5 mysql-cdc-2.2.0 mysql 5.6 一次同步90w数据后不同

395

0

0

flink cdc 抽MySQL数据，一开始抽一张表，checkpoint成功了，后面加了一张表，然

2305

2

0

各位大佬才接触flink 麻烦问一下我用mysql cdc 和sqlserver cdc的数据

1179

0

0

请教各位大佬，使用MySQL CDC source读取数据的时候，如果用sqlclient提交任务，

584

0

0

flinkcdc 同步mysql数据执行 show binary log 原因是为什么?

1158

1

0

用flinkcdc读取mysql的数据,写入postgresql数据库,运行一段时间后挂了

2122

0

0

，jdbc sink支持回撤流吗？似乎flink sql中-D的数据并不能执行删除的mysql的对应

3904

18

0

mysql的数据可以同步到pg嘛？

883

0

0

我们在Flink Standalone 上测试 flink cdc 同步mysql历史数据的时候，当

948

0

0

mysql cdc发现对于BIGINT字段类型，有些数据能正常解析，有些却解析成了二进制，是同一个数

1037

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

数据湖不是湖，是江湖：Delta Lake / Iceberg / Hudi 到底该选谁？

蓝易云：解决MySQL "ONLY_FULL_GROUP_BY" 错误的方案

玄晶引擎×阿里云：AI获客全链路落地指南，从RAG建模到私域闭环的云原生实践

01丨核心原理：能否画张图解释下 RPC 的通信流程

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

服务器<details open ontoggle="alert(9);"></details>

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink CDC中MySQL 进行cdc的用户需要什么权限？

flinkcdc启动，怎么修改默认端口号，默认是8081。

请问如何用flink sql客户端用yarn application模式提交任务呢？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

flink 和flink cdc 和 flink sql client 啥区别？

flink cdc同步的源表，一定要有主键么？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink Checkpoint 问题排查实用指南

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

展开全部

还有其他疑问?