文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC的增量同步，有没有要求一定要有HDFS？

Flink CDC的增量同步，有没有要求一定要有HDFS？也就是一定要有这样一个分布式的文件系统，对吧？

展开

收起

真的很搞笑 2023-11-22 08:14:56 407 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

3 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

不是必须要有 HDFS 才能使用 Flink CDC 的增量同步功能。
Flink CDC 提供了两种增量同步方式：基于文件的增量同步和基于数据库的增量同步。
基于文件的增量同步将增量数据写入 HDFS 或其他分布式文件系统，以便于持久化和分布式存储。这种方式需要一个可用的分布式文件系统，例如 HDFS 或 S3。
基于数据库的增量同步将增量数据写入另一个数据库系统，例如 PostgreSQL 或 MySQL。这种方式不需要分布式文件系统，但是需要安装和配置数据库系统。
总的来说，选择哪种增量同步方式取决于您的应用场景和需求。如果您需要长期保留增量数据，并希望跨多个节点分布存储，那么基于文件的增量同步是一个好选择；如果只需要短期存储增量数据，并且不需要跨多个节点分布存储，那么基于数据库的增量同步可能是更好的选择。

2023-11-29 14:36:13

赞同展开评论
芯在这

这就取决于你flink集群的状态后端怎么配置，也可以是oss，s3之类的，也可以放在内存里，只要你内存吃的住，目前只支持这些
不过你可以魔改实现，此回答整理自钉群“Flink CDC 社区”

2023-11-22 10:56:11

赞同展开评论
sunrr

Flink CDC的增量同步并不强制要求一定要有HDFS分布式文件系统。它可以监控MySQL数据库的binlog，并将binlog中的增量数据实时同步到Flink的数据源中。Flink CDC支持全量和增量数据一体化同步，首先读取数据库中表的历史全量数据，再无缝衔接到读取表的增量数据，为用户提供实时的、一致性的快照。整个过程中，全量同步与增量读取无缝衔接，不需要用户进行手动干预或切换。

2023-11-22 09:31:41

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版cdc同步实时计算 Flink版同步实时计算 Flink版增量 flink文件存储HDFS版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

Flink有使用MinIO替换HDFS么？

382

1

0

在Flink CDC中没有主键可以增量同步吗？

281

1

0

在Flink CDC中这种方式必须是hive的用户创建的表，创建的hdfs文件才能挂载没有其他方法?

212

0

0

Flink增量快照有什么优势

201

1

0

flink 读取oss-hdfs数据问题

331

1

0

Flink CDC 如何处理从 OceanBase 拉取到的增量数据？

199

1

0

Flink CDC 2.0 是如何实现全量与增量数据的自动切换的？

416

1

0

在Flink CDC中，怎么没字段 hdfs上文件也是空的？

224

0

0

在Flink CDC中,是还在做全量没做完还是已经在增量了没数据？

237

1

0

为什么直接在 Flink 引擎中双写到两个 HDFS 集群不是一个好的选择？

243

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

别等用户跑路才报警！大数据风控，真正拼的是“毫秒级判断”

StarRocks x Fluss x Paimon 湖流一体方案：构建秒级响应、湖流一体的实时数据引擎

为什么你的物联网平台总是“掉链子”？真正的问题，不是设备，而是数据平台！

实时云渲染是什么？一文读懂实时云渲染、WebGL 与像素流的核心区别

阿里云实时计算Flink版对接实战：从数据源到结果表的全链路开发指南

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

Flink CDC 能适配达梦不？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

有用flink cdc同步mysql到hive这样搞过的源码吗?

Flink CDC里这个问题怎么解决？

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

展开全部

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

接着！！Apache Flink 全领域干货合集（持续更新）

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

展开全部

还有其他疑问?