文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC在获取全量数据阶段的时候是基于查询的，还是基于binlog日志的呢？

如果是数据采集的这个阶段的话，是不是依靠什么无锁算法啥的处理一致性的，但是我就是觉得Flink CDC在获取全量数据阶段的时候是基于查询的，还是基于binlog日志的呢？

展开

收起

游客6vdkhpqtie2h2 2022-09-08 11:19:53 736 版权

1 条回答

写回答

取消提交回答

游客q42gezw5yens6
看源码，基于查询的
```
  <dependency>
      <groupId>com.ververica</groupId>
      <artifactId>flink-connector-mysql-cdc</artifactId>
      <version>2.2.0</version>
  </dependency>
```
查记录总数及任务分割
com.ververica.cdc.connectors.mysql.source.assigners.ChunkSplitter

private List splitTableIntoChunks() {
final Object[] minMaxOfSplitColumn = queryMinMax(jdbc, tableId, splitColumnName);
}

查询数据

com.ververica.cdc.connectors.mysql.debezium.task.MySqlSnapshotSplitReadTask

private void createDataEventsForTable () {

ResultSet rs = selectStatement.executeQuery()

}
2023-11-08 18:44:51

赞同展开评论

问答分类：

流计算实时计算 Flink版日志服务

问答标签：

日志服务数据实时计算 Flink版CDC 数据binlog 日志服务binlog 实时计算 Flink版数据

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

follow节点的binlog日志没有自动清理

268

开源PolarDB-X｜follow节点的binlog日志没有自动清理

1045

canal server在同步binlog日志的时候表结构发生变化改怎么处理？

590

如何收集云数据仓库ADB binlog日志

252

flink1.11日志上报

800

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2307

1894

flink cdc(mysql) -> elasticsearch7, 任务每次持续跑了一段时间之后

1463

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

6320

各位大佬，请教个问题，使用flink cdc读取数据时，如果配置一个表，数据过滤是发生在server

2170

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

阿里云日志服务对接Grafana可视化全流程实操指南

阿里云表格存储Tablestore对接使用完全指南：从入门到实战

别等用户跑路才报警！大数据风控，真正拼的是“毫秒级判断”

StarRocks x Fluss x Paimon 湖流一体方案：构建秒级响应、湖流一体的实时数据引擎

为什么你的物联网平台总是“掉链子”？真正的问题，不是设备，而是数据平台！

Flink CDC在获取全量数据阶段的时候是基于查询的，还是基于binlog日志的呢？

实时计算 Flink

相关文章

相关解决方案

热门讨论

热门文章