文档备案控制台

开发者社区问答正文

Flink中的RocksDB的术语Compaction具体是什么？

Flink中的RocksDB的术语Compaction具体是什么？

展开

收起

游客vwuxaq6iqaowc 2021-12-09 14:07:21 855 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客hveo756ydhs3k

LSM-Tree 能将离散的随机写请求都转换成批量的顺序写请求（WAL + Compaction），以此提高写性能。但也带来了一些问题：

读放大（Read Amplification）。LSM-Tree 的读操作需要从新到旧（从上到下）一层一层查找，直到找到想要的数据。这个过程可能需要不止一次 I/O。特别是 range query 的情况，影响很明显。空间放大（Space Amplification）。因为所有的写入都是顺序写（append-only）的，不是 in-place update ，所以过期数据不会马上被清理掉。写放大。实际写入 HDD/SSD 的数据大小和程序要求写入数据大小之比。正常情况下，HDD/SSD 观察到的写入数据多于上层程序写入的数据。 RocksDB 和 LevelDB 通过后台的 compaction 来减少读放大（减少 SST 文件数量）和空间放大（清理过期数据），但也因此带来了写放大（Write Amplification）的问题。

写放大、读放大、空间放大，三者就像 CAP 定理一样，需要做好权衡和取舍。

压缩算法有很多种，RocksDB也支持很多种，这里我们看两个经典的压缩算法及区别

2021-12-09 14:07:40

赞同展开评论

问答分类：

流计算实时计算 Flink版

问答标签：

实时计算 Flink版rocksdb 实时计算 Flink版rocksdb术语

问答地址：

开发者社区 > 大数据 > 问答

相关问答

flink用rocksdb作为状态后端，jobmanager重启后rocksdb目录文件会被清空

326

0

0

flink是配置rocksdb比较好还是filesystem这个比较好？

419

2

0

flink中checkpoint、io_tmp、rocksdb目录下会产生非常多的hardlink

243

1

0

使用RocksDB作为Flink状态后端相比1.0版本有哪些优势？

185

1

0

请问有人使用过flink rocksdb 存业务数据吗？

102

1

0

在Flink CDC中rocksdb的调优应该怎么调？

138

1

0

在Flink CDC中rocksdb支持算子状态吗？

135

0

0

Flink SQL作业如何配置rocksdb statebackend参数

191

1

0

FLink的state.backend模式修改为rocksdb之后，是还需要调整什么其他的参数吗？

495

0

0

Flink这个情况下是不是使用rocksdb比较好？

168

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

部署coclaw，报错如下，怎么办？应该点击哪里？

claude code接入千问3.5效果怎么样如题,用过的老哥给评测一下

灵码如何使用skills呢

copaw在魔搭平台搭建控制面板卡死重启无效

阿里云服务器镜像系统选哪个比较好？稳定和兼容性如何？

相关文章

基于Flink CDC的企业级日志实时入湖入流解决方案

Flink 实时计算 x SLS 存储下推：阿里云 OpenAPI 网关监控平台实践

【最优潮流】二阶锥松弛在配电网最优潮流计算中的应用（Matlab代码实现）

数仓-湖仓-湖流，人力家基于阿里云OpenLake架构演进与思考

9B 上端侧：多模态实时对话，难点其实在“流”

还有其他疑问?