文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC全量阶段能按照时间来吗，一些长时间的历史数据不想要？

Flink CDC全量阶段能按照时间来吗，一些长时间的历史数据不想要？

展开

收起

真的很搞笑 2023-12-04 08:09:25 201 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

Flink CDC 确实分为全量阶段和增量阶段。在全量阶段，Flink会先获取全局读锁，然后获取整个MySQL实例的全局锁，所有连接MySQL的DDL DML操作均会处于等待读锁阶段。这个阶段通常需要花费较长时间，尤其是当处理的数据表较大时。

2023-12-04 14:10:10

赞同展开评论
sunrr

是的，Flink CDC（Change Data Capture）可以在全量阶段根据时间来进行过滤。你可以在读取源数据库的全量数据时，只选择某个时间范围的数据进行同步。

例如，如果你有一个表，你想从昨天开始同步这个表的变更数据，你可以设置CDC的时间过滤器为昨天的零点。这样，Flink只会读取昨天零点后发生的数据变化，而不会读取之前的历史数据。

2023-12-04 11:49:15

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版数据实时计算 Flink版cdc数据实时计算 Flink版全量实时计算 Flink版全量数据

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink大概什么样的场景会需要用到流批一体？一边处理实时流，一边批处理历史数据

296

1

0

Flink写入结果表会清除目标表里面的历史数据吗

192

1

0

Flink CDC里用的datastream，不知道为什么每次都会消费历史数据？

184

1

0

Flink CDC里最近遇到一些表无法先全量再增量同步，具体表现就是启动任务后，一直没数据怎么办？

482

0

0

Flink CDC里全量阶段开了之后，checkpoint的文件过大，现在不知道怎么优化了？

424

1

0

Flink默认先全量再增量同步，全量时会对checkpoint上锁，导致请求检查点时失败，任务重启

546

1

0

Flink CDC 在并行读取全量和增量数据时面临的主要挑战是什么？

363

1

0

在Flink CDC中，mysql有个150g的数据，全量同步的话，有啥优化点吗？

475

1

0

请问下Flink，需求做一个宽表，有大量大表join，如果需要跑大数据量的历史数据该怎么处理？

283

0

0

在Flink CDC中读取全量和增量数据能不能安装数据的生成顺序输出？

172

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

广告竞价为什么要拼毫秒级速度？揭秘 RTB 实时广告系统背后的数据流水线设计

告别干扰困扰！RFID手持机在复杂仓储中的可靠表现

分链路差异化设计的DSP准实时数仓｜钛动科技基于阿里云实时计算 Flink 版 + DLF Paimon + EMR Serverless StarRocks 的实践

Arduino IDE下载安装和汉化一篇搞定（2026最新）

EMR + Flink 实战：从离线T+1到实时数仓的完整迁移路径

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

flinkcdc在IDEA运行正常，打包就报错

Segment Key主要应用在哪些场景？

Flink cdc sqlserver 希望不同步某些数据行

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

Flink CDC 能适配达梦不？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

大佬们，我目前的场景是flinkcdc 用sql将mongo数据同步到es，有人做过这样的场景吗？

Flink CDC底层监听是不是用到flink定时任务还是啥？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

展开全部

还有其他疑问?