备案控制台

开发者社区问答正文

HBase中表的设计Compact & Split是什么？

HBase中表的设计Compact & Split是什么？

展开

收起

真的很搞笑 2021-12-05 14:51:54 484 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

在HBase中，数据在更新时首先写入WAL 日志(HLog)和内存(MemStore)中，MemStore中的数据是排序的，当MemStore累计到一定阈值时，就会创建一个新的MemStore，并且将老的MemStore添加到flush队列，由单独的线程flush到磁盘上，成为一个StoreFile。于此同时，系统会在zookeeper中记录一个redo point，表示这个时刻之前的变更已经持久化了(minor compact)。

StoreFile是只读的，一旦创建后就不可以再修改。因此Hbase的更新其实是不断追加的操作。当一个Store中的StoreFile达到一定的阈值后，就会进行一次合并(major compact)，将对同一个key的修改合并到一起，形成一个大的StoreFile，当StoreFile的大小达到一定阈值后，又会对 StoreFile进行分割(split)，等分为两个StoreFile。

由于对表的更新是不断追加的，处理读请求时，需要访问Store中全部的StoreFile和MemStore，将它们按照row key进行合并，由于StoreFile和MemStore都是经过排序的，并且StoreFile带有内存中索引，通常合并过程还是比较快的。

实际应用中，可以考虑必要时手动进行major compact，将同一个row key的修改进行合并形成一个大的StoreFile。同时，可以将StoreFile设置大些，减少split的发生。

2021-12-05 14:52:08

赞同展开评论

问答分类：

分布式数据库 Hbase 云数据库HBase版

问答标签：

云数据库HBase版compact 云数据库HBase版设计云数据库HBase版compact split 云数据库HBase版split

问答地址：

开发者社区 > 数据库 > 问答

相关问答

hbase要导入一亿行用户表数据，如果用自增主键作为rowkey会出现什么问题，要怎么设计rowke

863

1

0

HBase 中 compact 用途是什么？

340

1

0

Hbase中表设计优化方法有哪些呢？

390

1

0

HBASE中compact的作用是什么呢？

307

1

0

HBase Compact &&Split是什么？

345

1

0

Hbase实战之谷粒微博的代码设计需要从哪些方面来设计？

451

1

0

HBase表设计的设计原则是什么？

696

1

0

HBase工作中的HBase Compact &&Split的作用是什么？

356

1

0

在每天增量数据较大（每天大约5T左右）时，在设计表和Hbase整体的参数配置方面有何建议？

428

1

0

HBase优化方法中列族的设计缺点是什么？

400

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

成都｜12月20日PolarDB数据库技术沙龙开启报名

定档1月20日｜2026阿里云PolarDB开发者大会，上海见！

玄晶引擎×阿里云：AI获客全链路落地指南，从RAG建模到私域闭环的云原生实践

2025年数据库性能压测工具对比：重点测试方案与工具选型指南

阿里云位居 IDC MarketScape 中国分布式事务型数据库领导者类别

还有其他疑问?