备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

我是jdbc连接器，应该和这无关吧，请教这种问题有人遇到过吗？

使用 postgres cdc读取源postgres表，jdbc cdc 写到目标postgres表，在命令行提交job后，会生成两个job, 一个是读数据源的job，一个是insert到目标表的job，这个insert job 会一直反复进行重试和运行，但是数据是可以同步的，查看异常显示如下：

查看github上QA文档，有一条类似的错误：

但是我是jdbc连接器，应该和这无关吧，请教这种问题有人遇到过吗？

展开

收起

游客6vdkhpqtie2h2 2022-09-08 10:52:08 459 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

根据您描述的情况，您在使用Postgres CDC连接器读取源PostgreSQL表，并通过JDBC CDC连接器将数据写入目标PostgreSQL表时，遇到了插入作业（sink端）持续重试和运行的问题，尽管数据同步实际完成。您提到的异常信息虽然未直接给出，但您提到了一个GitHub上的QA文档中存在类似错误，且该错误与您的JDBC连接器看似关联不大。

结合知识库资料，这里提供一些可能的排查方向和解决建议：

问题分析

重复提交或确认问题：JDBC sink在某些情况下可能会因为事务提交、确认逻辑出现问题，导致认为写入未成功而不断重试。
网络瞬断或延迟：网络不稳定可能导致sink端认为写入操作未得到及时确认，从而触发重试机制。
目标数据库配置：目标PostgreSQL的配置（如事务隔离级别、自动提交设置等）可能与sink端的行为不兼容。
Sink配置不当：JDBC sink的配置参数，如flush.interval.ms、connection.max-retry-attempts等，可能需要调整以适应当前环境。

解决步骤

检查sink端日志：详细查看sink端（即JDBC CDC连接器）的执行日志，定位具体的错误信息和重试原因。这有助于直接理解重试背后的错误详情。
验证目标表状态：确保目标表没有锁、独占访问或其他并发写入冲突，这些都可能导致写入操作看似未完成。
审查JDBC Sink配置：
- 确认sink.parallelism是否适当，避免过高的并行度导致资源竞争或锁冲突。
- 调整sink.flush.interval，增加间隔时间可能减少不必要的重试。
- 检查是否有误配置的重试策略，比如connection.max-retry-attempts是否设置得当。
网络稳定性检查：确认网络连接稳定，尤其是如果部署在分布式环境中，网络延迟或丢包可能是问题根源。
目标数据库优化：
- 确认目标数据库的事务隔离级别是否与sink行为兼容。
- 考虑调整数据库的连接池大小、超时设置等，以提高处理能力。
版本兼容性：确认使用的Flink版本、JDBC驱动版本以及PostgreSQL版本之间是否存在已知的兼容性问题。

注意事项

资源监控：在调整配置或进行测试时，注意监控系统资源使用情况，避免因资源不足引发其他问题。
事务管理：正确配置sink的事务管理，确保数据一致性的同时减少不必要的重试。

由于您未提供具体的错误信息，上述建议较为通用。针对实际情况，请结合具体错误日志进行细致分析和调整。如果问题依然存在，考虑在相关技术社区或官方支持渠道寻求帮助，提供详细的错误日志和配置信息以便获得更专业的指导。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

Java 数据库连接实时计算 Flink版

问答标签：

jdbc连接 jdbc连接器

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink有没有人用过JDBC连接器sink的时候删除数据？

502

2

0

Flink CDC中MySQL CDC的JDBC连接建立和关闭是在jobManager 完成的吗？

178

1

0

java通过jdbc使用odps-jdbc 3.5.7版本连接MaxCompute总是报错

178

0

0

阿里云的flink能用jdbc连接器吗。我用jdbc connector往mysql里写入数据，任？

251

3

0

flink不是自带了jdbc的连接器吗，为什么会提示没有driver？

131

1

0

在Flink CDC中使用jdbc连接器写入mysql，中文变成问号了，要加什么配置吗？

151

1

0

可以通过postgresql jdbc协议连接大数据计算MaxCompute吗？

131

2

0

Flink CDC中jdbc连接器里面如果这个上下界中存在null ，怎么处理呢？

82

1

0

云数据仓库ADB通过MySQL JDBC连接AnalyticDB 驱动版本，怎么操作？

115

1

0

OceanBase数据库jdbc负载均衡模式直接连接后面多个obproxy其中一个obproxy故障

379

3

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199213

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

除了JDBC，还有哪些常见的数据库访问技术？

try、catch、finally、throw、throws 的用法，finally 块一定会执行吗？举反例说明。

Cloud Naive最佳开发实践

RedisFX Maven 使用教程

【App Service】部署War包到Azure云上遇404错误

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

debezium的配置是在代码里面如何添加进去的呢

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

在斗鱼，实时计算发展的历程如何？

请问如何用flink sql客户端用yarn application模式提交任务呢？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink CDC中mysql cdc 的那个server_id 设置的话，一般是怎么设置的？

Apache Flink未授权访问上传导致的RCE漏洞，这个漏洞目前方案解决吗？

在Flink CDC中ogg可以做实时同步吗？

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

为什么说流处理即未来？

展开全部

还有其他疑问?