文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC增量只能是1,但是binlog数量很大延迟到小时级别有什么建议吗？

Flink CDC增量只能是1,但是binlog数量很大延迟到小时级别有什么建议吗？

展开

收起

真的很搞笑 2023-12-19 08:07:20 274 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
如果发现Flink CDC的增量同步速度较慢，导致延迟增加，可以尝试以下优化措施：
1. 数据库优化：提高binlog生成的效率可以有效缓解读取慢的问题。这可以通过调整MySQL数据库的参数来实现，例如优化binlog缓存大小、调整binlog_format格式或关闭不必要的binlog功能等。
2. Flink参数优化：你可以适当调整Flink CDC的运行参数以提高其性能。例如，可以调整输入输出缓冲区的大小、优化内存占用情况、增加任务的并行度或设置回压策略等。
3. 数据过滤：合理设置过滤规则可以防止不必要的数据流入Flink CDC中，这样既可以节省处理时间，也有助于减少网络传输的压力。
4. 网络优化：如果Flink CDC需要从远程Oracle数据库中读取binlog，那么网络延迟可能会影响到读取速度。在这种情况下，你可能需要优化网络环境以降低延迟。
2023-12-19 20:33:22

赞同展开评论
芯在这

如果这么大的话，适当调整下debezium的采集数据大小，flink单并行度处理这些数据，还是easy的，是不是上游采集的太慢造成的问题。，此回答整理自钉群“Flink CDC 社区”

2023-12-19 16:15:40

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 增量binlog 实时计算 Flink版增量实时计算 Flink版binlog flink binlog

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink新增的表已经全量同步了，如果我们升级版本后，是会从当前时间的增量数据开始同步吗，还是什么？

181

1

0

OceanBase Canal 和 Flink CDC 拉取 OceanBase 增量日志上有什么？

224

1

0

Flink CDC 如何处理从 OceanBase 拉取到的增量数据？

159

1

0

Flink CDC OceanBase Connector 是如何实现数据增量的拉取的？

147

1

0

如何实现 Flink CDC 中全量和增量日志的并行读取？

297

1

0

Flink CDC 2.0 在新增表时为什么会停止 Binlog 日志流？

187

1

0

Flink的hologres的维度表也需要开启binlog吗？

214

1

0

flink-cdc 在抽取mysql binlog，运行一段时间 source 就报java.uti

1337

3

0

请问 flinkcdc的时候 checkpoints里的mysql binlog pos不变吗？

879

10

0

大佬们，cdc mysql 可以获取binlog，binlog模式必须是row吗？

1067

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

「DuckDB-Paimon实操」6分钟上手，数据湖分析快人一步

从 T+1 到分钟级：金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台

PAI-FeatureStore特征平台的相关问答

给 Hermes 装上显微镜：Agent 执行全知道

openapi swagger skills

热门讨论

热门文章

如何用实时数据同步打破企业数据孤岛？

flinkcdc在IDEA运行正常，打包就报错

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

在Flink CDC中，直接将我生成的application会话kill掉了,有人遇到过吗？

Flink CDC Hbase字段类型跟flinksql类型，转换的java代码吗？

这个AI 说的 Flink的每个key状态和每个并行度的状态怎么测试区分？

请问mysql-cdc支持在pyflink中将数据从mysql-cdc输入到doris吗？

展开全部

数据仓库介绍与实时数仓案例

流计算StreamCompute

Flink Checkpoint 问题排查实用指南

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

Apache Flink 漫谈系列(04) - State

深入了解 Flink 网络栈（二）：监控、指标和处理背压

Apache Flink 进阶（五）：数据类型和序列化

Flink SQL 功能解密系列 —— 阿里云流计算/Blink支持的connectors

携程实时智能检测平台建设实践

展开全部

还有其他疑问?