备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC中Binlog日志没有存那么久，那怎么全量同步呢？

Flink CDC中Binlog日志没有存那么久，那怎么全量同步呢，select？这个快照是否类似datax的模式，那全量同步是否阻塞来保障数据一致性的，或者是有什么魔法，这块比较迷惑。

展开

收起

十一0204 2023-08-16 08:05:05 171 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

游客q42gezw5yens6

全量同步是基于查询的，类似datax
具体看flink-connector-mysql-cdc源码.

查记录总数及任务分割
com.ververica.cdc.connectors.mysql.source.assigners.ChunkSplitter
private List splitTableIntoChunks() {
final Object[] minMaxOfSplitColumn = queryMinMax(jdbc, tableId, splitColumnName);
}

查询数据

com.ververica.cdc.connectors.mysql.debezium.task.MySqlSnapshotSplitReadTask
private void createDataEventsForTable () {

ResultSet rs = selectStatement.executeQuery()

}

2023-11-08 18:52:00

赞同展开评论
意中人jswy

意中人就是我呀！

全量同步好像是使用的快照，不是binlog 日志，官网有说明，你看下，flink 会自动从全量切换到增量。增量快照不是datax的模式（无锁），具体实现去看原理，群文件都有或者github的wiki里面有书本。此答案整理至钉群“Flink CDC 社区“。

2023-08-16 08:34:37

赞同展开评论

问答分类：

DataX 流计算实时计算 Flink版日志服务数据集成 Data Integration

问答标签：

实时计算 Flink版CDC 日志服务binlog binlog日志 binlog日志服务实时计算 Flink版同步

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink CDC中，binlog 回放的时候，是不是应该把Executed去掉?

99

0

0

canal server在同步binlog日志的时候表结构发生变化改怎么处理？

408

3

0

flink CTAS 同步mysql数据，mysql需要开启binlog吗？

223

2

0

DataWorks同步任务日志里面这个All Task WaitWriterTime很高是什么原因呀

279

1

0

在Flink CDC中，请问下是没有数据，但却有binlog吗？

124

1

0

在Hologres，尝试通过datastudio基于binlog 同步polardb单表到holo?

123

2

0

DataWorks如何使用terraform创建sls日志同步任务？

202

14

0

在Flink CDC中同步oracle需要开启的几个日志参数对业务库的性能影响有点大，如何解决？

204

1

0

Dataworks 离线数据同步，从 odps 同步到 sls，是否支持sls的日志时间配置设置？

149

1

0

Flink多个表的同步顺序是按照binlog顺序执行的么？有个表的同步失败了会影响后续执行吗？

101

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

Forrester发布流式数据平台报告：Flink 创始团队跻身领导者行列，实时AI能力获权威认可

一文带你玩转 WebSocket 全链路可观测

《构建游戏实时流失预警模型的核心逻辑》

别再全量拉表了兄弟：一篇讲透增量数据处理与 CDC 的实战指南

用 Flink 做实时 ETL：别只盯着算子，真正的灵魂是「语义、状态和扛事能力」

热门讨论

热门文章

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

flink cdc source端能降低消费速度嘛？

flink cdc同步的源表，一定要有主键么？

Flink CDC 人大金仓能作为source吗？支持bin-log吗？

服务器<details open ontoggle="alert(9);"></details>

Flink CDC把主表先全量同步到索引中更新到索引中这种怎么搞？

Flink CDC中mysqlcdc 2.4.1 出现这个问题？

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

我使用flink cdc StartupOptions.latest() 采最新的日志。要是程序挂了

展开全部

数据仓库介绍与实时数仓案例

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

展开全部

还有其他疑问?