备案控制台登录注册

开发者社区问答正文

Flink中对于state不是很大，但是需要频繁checkpoint的任务，backendstate

Flink中对于state不是很大，但是需要频繁checkpoint的任务，backendstate是选file还是rockdb呀，看官档说的是rockdb适合state很大的任务，可能吞吐会降低。但是如果选用file的话对hdfs的压力又很大 *来自志愿者整理的flink邮件归档

收起

雪哥哥 2021-12-07 16:18:16 620 版权

举报

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客sadna6pkvqnz6

hi

首先，就算选择rocksDB statebackend，也是需要写HDFS的，只是在开启了incremental checkpoint方式情况下可以减少每次hdfs数据写入。

我觉得这个问题核心是一个trade off。不做checkpoint的时候，RocksDBStateBackend的读写性能不如纯内存的FsStateBackend。而在checkpoint的同步阶段，RocksDB stateBackend需要全量写本地磁盘，比FsStateBackend的内存操作可能要慢一些，也会影响吞吐。在checkpoint的异步阶段，由于RocksDB stateBackend支持增量上传，所以对HDFS的压力可能要更小一些；但同时，也可以通过打开对FsStateBackend的压缩[1] 来降低FsStateBackend对HDFS的压力。

如果你对吞吐很敏感的话，在state很小的时候，可以选择FsStateBackend，否则应该选择RocksDBStateBackend，可以避免OOM的风险。

[1] https://ci.apache.org/projects/flink/flink-docs-stable/ops/state/large_state_tuning.html#compression*来自志愿者整理的flink

2021-12-07 16:37:41 举报

赞同评论

评论
全部评论 (0)
登录后可评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版任务实时计算 Flink版checkpoint任务实时计算 Flink版checkpoint 实时计算 Flink版State 实时计算 Flink版state checkpoint任务

问答地址：

开发者社区 > 大数据 > 问答

相关问答

在Flink CDC中Oracle redolog 频繁切换，是上面哪个原因呢？

68

0

0

Flink state如何进行兼容性判断

52

1

0

Flink中keyed state 不keyby()的流, 怎么存储状态呢？

321

1

0

Flink CDC看到频繁fullgc,目前增加了heartbeat timeout，有什么建议？

298

3

0

我这边有个flink job周末一直在报GC频繁，然后oom ，然后连接异常，被判定失联，怎么解决？

290

2

0

Flink CDC在这种情况下，A,B数据也不能过期，所以这个state会越来越大？

73

2

0

Flink意外宕机的话是有概率造成state丢失重启后重复计算的么？

58

1

0

Flink的 jar作业如果里面用了state 最终是保存在内存还是外部存储？

95

1

0

为什么 Flink SQL 在判断 state 是否兼容时存在漏洞？

32

1

0

flink checkpoint 频繁重启，能否失败直接跳过？

239

8

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

一键生成讲解视频，AI的理解和生成能力到底有多强？

在工作中如何成为一个“不纠结”的人？

怎么让一张流程表单提交后，自动将这张表单的数据填入另一张流程表单并提交？

传统动画创作 VS AI动画创作，你更偏向哪一个？

2025 年 AI 产业会迎来全面爆发吗？

相关文章

探索Flink动态CEP：杭州银行的实战案例

CI/CD（五）Flink 应用部署

21.3亿次！阿里云支撑总台春晚实现史上最广覆盖！

感谢认可！阿里云云原生大规模云边协同技术荣获浙江省科学技术进步奖一等奖

Flink CDC + Hologres高性能数据同步优化实践

还有其他疑问?

你好，我是AI助理

可以解答问题、推荐解决方案等