文档备案控制台

开发者社区问答正文

HBase中表的设计Compact & Split是什么？

HBase中表的设计Compact & Split是什么？

展开

收起

真的很搞笑 2021-12-05 14:51:54 580 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

在HBase中，数据在更新时首先写入WAL 日志(HLog)和内存(MemStore)中，MemStore中的数据是排序的，当MemStore累计到一定阈值时，就会创建一个新的MemStore，并且将老的MemStore添加到flush队列，由单独的线程flush到磁盘上，成为一个StoreFile。于此同时，系统会在zookeeper中记录一个redo point，表示这个时刻之前的变更已经持久化了(minor compact)。

StoreFile是只读的，一旦创建后就不可以再修改。因此Hbase的更新其实是不断追加的操作。当一个Store中的StoreFile达到一定的阈值后，就会进行一次合并(major compact)，将对同一个key的修改合并到一起，形成一个大的StoreFile，当StoreFile的大小达到一定阈值后，又会对 StoreFile进行分割(split)，等分为两个StoreFile。

由于对表的更新是不断追加的，处理读请求时，需要访问Store中全部的StoreFile和MemStore，将它们按照row key进行合并，由于StoreFile和MemStore都是经过排序的，并且StoreFile带有内存中索引，通常合并过程还是比较快的。

实际应用中，可以考虑必要时手动进行major compact，将同一个row key的修改进行合并形成一个大的StoreFile。同时，可以将StoreFile设置大些，减少split的发生。

2021-12-05 14:52:08

赞同展开评论

问答分类：

分布式数据库 Hbase 云数据库 HBase 版

问答标签：

云数据库 HBase 版compact 云数据库 HBase 版设计云数据库 HBase 版compact split 云数据库 HBase 版split

问答地址：

开发者社区 > 数据库 > 问答

相关问答

hbase要导入一亿行用户表数据，如果用自增主键作为rowkey会出现什么问题，要怎么设计rowke

964

1

0

HBase 中 compact 用途是什么？

406

1

0

Hbase中表设计优化方法有哪些呢？

463

1

0

HBASE中compact的作用是什么呢？

386

1

0

HBase Compact &&Split是什么？

751

1

0

Hbase实战之谷粒微博的代码设计需要从哪些方面来设计？

516

1

0

HBase表设计的设计原则是什么？

771

1

0

HBase工作中的HBase Compact &&Split的作用是什么？

440

1

0

在每天增量数据较大（每天大约5T左右）时，在设计表和Hbase整体的参数配置方面有何建议？

508

1

0

HBase优化方法中列族的设计缺点是什么？

475

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

矩阵账号批量直播，单套软件最多能同时运营几个账号？

能不能靠谱点？每天更新，自己发现不了问题？测试人员都栽了吗？

完全没有直播经验，上手 AI 直播需要多久？

动态变量话术引擎对直播有什么作用？

在vs code安装Qoder CN，登录并订阅了个人专业版，无法使用，急急急

相关文章

分布式数据库如何保证高可用与多活容灾？Paxos 多副本架构详解 —— 阿里云 PolarDB-X

分布式数据库分片策略怎么设计？透明分片实践 —— 阿里云 PolarDB-X

PolarDB MySQL版 V2.0轻量版：精简模式（PolarFlex）版本发布日志

高并发缓存和数据库怎么配合？缓存加数据库架构详解

数据仓库和数据库有什么区别？企业要不要上数仓

还有其他疑问?