文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC全量历史数据比较多，全量同步阶段时间长会同时读取binlog进行合并输出吧？

Flink CDC全量历史数据比较多，全量同步阶段时间长会同时读取binlog进行合并输出吧，比如新增一张表全量同步耗时三个小时，binlog文件只保留近一个小时的，会影响全量到增量的衔接么，会阻塞其它表的binlog采集么？

展开

收起

真的很搞笑 2023-12-25 08:05:50 214 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

如果全量同步三小时才结束，binlog只保留1小时，到了增量阶段，会报错找不到binlog了，建议使用增量快照算法加大并行度，加快历史数据消费，或者增大binlog保存时间（一般是7天），此回答整理自钉群“Flink CDC 社区”

2023-12-25 14:57:02

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 数据binlog 实时计算 Flink版数据实时计算 Flink版cdc同步实时计算 Flink版同步

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink默认先全量再增量同步，全量时会对checkpoint上锁，导致请求检查点时失败，任务重启

467

1

0

为什么使用FlinkCDC和Kakfa Sink向Kakfa中发送binlog数据，会存在脏数据？

303

1

0

flink每次全量覆盖是因为基于日志的不准吗?

160

1

0

在Flink CDC中，请问下是没有数据，但却有binlog吗？

316

1

0

PolarDB的binlog数据量不到1T的情况下，业务低峰期开启能不能导致闪电时间降低？

172

1

0

PolarDB开启binlog重启集群会不会影响数据准确性？

183

1

0

flink结合历史数据怎么处理

1888

1

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2234

1

0

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

1654

0

0

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1415

2

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

MPC模型预测控制MATLAB仿真程序实现

《采购与招标商品详情页前端性能优化实战》

「DuckDB-Paimon实操」6分钟上手，数据湖分析快人一步

从 T+1 到分钟级：金城银行基于 Apache Doris 构建高可靠、强一致的实时数据平台

PAI-FeatureStore特征平台的相关问答

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

多模态数据信息提取

Tair 实现即时通信场景中的消息多端同步

热门讨论

热门文章

如何用实时数据同步打破企业数据孤岛？

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flinkcdc在IDEA运行正常，打包就报错

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

有用flink cdc同步mysql到hive这样搞过的源码吗?

在Flink CDC中，直接将我生成的application会话kill掉了,有人遇到过吗？

Flink CDC Hbase字段类型跟flinksql类型，转换的java代码吗？

咨询下各位大佬，用Flink CDC 2.2.0同步MYSQL数据库，库表是latin1编码的时候？

请问mysql-cdc支持在pyflink中将数据从mysql-cdc输入到doris吗？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

展开全部

数据仓库介绍与实时数仓案例

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

广告场景下的实时计算

史上超强阵容！大数据及人工智能领域顶级盛会，Flink Forward Asia 2019 不容错过！

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

展开全部

还有其他疑问?