文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

使用 MySQL CDC 同步数据到 MongoDB 时，因为 MySQL 源表数据量很大怎么办？

使用 MySQL CDC 同步数据到 MongoDB 时，因为 MySQL 源表数据量很大（3亿条记录），我尝试执行 insert into mongo select * from mysql where id > 1亿。但是程序在处理 id < 1亿的数据时会卡住很长一段时间，之后才开始同步数据。有没有什么参数可以调整以减少这个卡顿时间？或者这个问题其实起始于 MySQL 源表的数据选择性能？有没有办法直接跳过不需要的前一亿条数据记录？

展开

收起

小小鹿鹿鹿 2024-03-19 23:19:26 241 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小小杳杳杳

数据再减少拉取，用between；尽量分批，索引生效。此回答来自钉群Flink CDC 社区。

2024-03-20 12:22:58

赞同 3 展开评论

问答分类：

关系型数据库 MySQL 流计算云数据库 RDS MySQL 版实时计算 Flink版云数据库 MongoDB 版

问答标签：

云数据库 RDS MySQL 版同步实时计算 Flink版CDC 云数据库 RDS MySQL 版数据实时计算 Flink版数据实时计算 Flink版同步

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

RDS无法备份/恢复库表数据

161

1

0

flink cdc同步MongoDB到mysql很慢，有什么方法可以就加快吗？

392

1

0

DataWorks 如何利用create_time增量T+1同步 MongoDB数据源的数据呢？

321

1

0

DataWorks中mongodb这种到毫秒的数据类型，同步到odps应该用什么类型才能保留毫秒？

215

1

0

用dataworks把mongodb数据同步到maxcompute，支持增量同步吗？

150

1

0

DTS是否支持MongoDB同步到Mysql

239

1

0

如何避免RDS数据库表数据量大耗时问题

183

1

0

RDS表数据量没有变化使用全文索引查询很慢

196

1

0

DMS无法导出云数据库RDS完整的表数据

230

1

0

DataWorks mongodb同步如何取json里的部分数据

192

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

AliSQL 新版本发布：DuckDB、VIDX、Native Flashback 与事务优化

Oracle 迁移到阿里云 RDS MySQL 完整方案与实战：5 步落地 + 踩坑清单

百万级数据 MySQL 跑不动了怎么办？首选阿里云 AnalyticDB MySQL 实时分析加速方案，10 倍+性能提升，DTS 分钟级平滑迁移

分链路差异化设计的DSP准实时数仓｜钛动科技基于阿里云实时计算 Flink 版 + DLF Paimon + EMR Serverless StarRocks 的实践

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink cdc sqlserver 希望不同步某些数据行

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

Flink CDC 能适配达梦不？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

深入了解 Flink 网络栈（二）：监控、指标和处理背压

Flink: 快速构建统一的实时日志平台

Apache Flink 漫谈系列(15) - DataStream Connectors之Kafka

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

展开全部

还有其他疑问?