文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

Flink CDC首次全量同步几百万数据，状态后端增量方式的rocksdb，正常的吗？

Flink CDC首次全量同步几百万数据，状态后端增量方式的rocksdb，目前Checkpointed Data Size 基本接近Full Checkpoint Data Size大小，正常的吗？ck耗时也很长，请问可以从哪些方面优化优化？

展开

收起

真的很搞笑 2024-01-09 11:28:11 346 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
Flink CDC首次全量同步几百万数据，状态后端增量方式的rocksdb，目前Flink CDC首次全量同步几百万数据，状态后端增量方式的rocksdb，目前Checkpointed Data Size基本接近Full Checkpoint Data Size大小，这是正常的。ck耗时也很长，可以从以下几个方面优化：
1. 调整checkpoint间隔时间，缩短checkpoint时间。
2. 调整statebackend的大小，增加statebackend的容量。
3. 调整并行度，提高处理速度。
2024-01-09 15:34:19

赞同展开评论

问答分类：

流计算云数据库 ClickHouse 实时计算 Flink版

问答标签：

实时计算 Flink版CDC 实时计算 Flink版数据实时计算 Flink版rocksdb flink后端实时计算 Flink版后端

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

若依springboot后端和微信小程序数据交互

307

0

0

Flink默认先全量再增量同步，全量时会对checkpoint上锁，导致请求检查点时失败，任务重启

546

1

0

Flink CDC 如何处理从 OceanBase 拉取到的增量数据？

200

1

0

Flink CDC 2.0 是如何实现全量与增量数据的自动切换的？

418

1

0

在Flink CDC中,是还在做全量没做完还是已经在增量了没数据？

242

1

0

在Flink CDC中读取全量和增量数据能不能安装数据的生成顺序输出？

171

0

0

modelscope-funasr这个实时语音后端，处理的是pcm还是wav格式的数据呢？

210

0

0

在Flink CDC中oceanbase oracle initial模式全量转增量读取报错怎么办？

499

7

0

Flink中的RocksDB的术语Ingest具体是什么？

602

1

0

各位大佬，请教一下，如果在flink cdc sql客户端使用SQL查询表，怎么能记录原系统的数据

2312

1

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

相关文章

实时云渲染是什么？一文读懂实时云渲染、WebGL 与像素流的核心区别

阿里云实时计算Flink版对接实战：从数据源到结果表的全链路开发指南

广告竞价为什么要拼毫秒级速度？揭秘 RTB 实时广告系统背后的数据流水线设计

告别干扰困扰！RFID手持机在复杂仓储中的可靠表现

分链路差异化设计的DSP准实时数仓｜钛动科技基于阿里云实时计算 Flink 版 + DLF Paimon + EMR Serverless StarRocks 的实践

相关解决方案

更多

Flink CDC 实现企业级实时数据同步

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

Tair 实现即时通信场景中的消息多端同步

分析 Agent 实现一键 AI 数据洞察

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

FLink 1.13版本升级Flink 1.17 报错，怎么解决？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

FLink 1.13版本升级Flink 1.17 报错，怎么处理？

Flink cdc sqlserver 希望不同步某些数据行

flink CDC 当第一次全量正常输出后，源表中数据任何变更就无法再被捕获到了，为什么？

Flink CDC底层监听是不是用到flink定时任务还是啥？

Flink 1.13版本升级Flink 1.17 报错有人知道为什么吗?

flinkcdc在IDEA运行正常，打包就报错

展开全部

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

流计算精品翻译: The Dataflow Model

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

使用 Kafka 和 Flink 构建实时数据处理系统

Flink: 实时规则引擎助力新零售发展

【阿里内部应用】基于Blink为新商业调控打造实时大数据交互查询服务

携程实时智能检测平台建设实践

展开全部

还有其他疑问?