文档备案控制台

开发者社区问答正文

为什么上层HBase选择LSM树这种索引结构？

为什么上层HBase选择LSM树这种索引结构？

展开

收起

令人无语的八阿哥 2021-10-22 15:41:19 676 版权

来自：华章出版社

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

追风少年刘全有

LSM树的索引结构本质是将写入操作全部转化成磁盘的顺序写入，极大地提高了写入操作的性能。但是，这种设计对读取操作是非常不利的，因为需要在读取的过程中，通过归并所有文件来读取所对应的KV，这是非常消耗IO资源的。因此，在HBase中设计了异步的compaction来降低文件个数，达到提高读取性能的目的。由于HDFS只支持文件的顺序写，不支持文件的随机写，而且HDFS擅长的场景是大文件存储而非小文件，所以上层HBase选择LSM树这种索引结构是最合适的。

资料来源：《HBase原理与实践》，文章链接：https://developer.aliyun.com/article/724670

2021-10-22 16:01:50

赞同展开评论

问答分类：

分布式数据库索引 Hbase 云数据库 HBase 版

问答标签：

云数据库 HBase 版结构云数据库 HBase 版索引云数据库 HBase 版树

问答地址：

开发者社区 > 华章出版社 > 问答

相关问答

为什么说进入HBase后没有真正的索引呢？

1760

1

0

HBase的索引是什么呢？

749

1

0

hbase的存储结构是什么？

448

1

0

HBase 中一个cell 的结构是什么？

630

1

0

HBase中KeyValue结构是什么样的？

716

1

0

传统数据库一个表的结构与HBase数据库的表结构的不同点在哪儿？

709

1

0

HBase二级索引概念是对应Rowkey这个“一级”索引的说法正确吗？

985

1

0

HBase构建二级索引的实现方式有哪些？

785

1

0

阿里的hbase怎么异步创建phoenix二级索引?

850

1

0

请问有没有大佬能分享下hbase源码模块结构的说明，或者有没有相关文章？

1141

1

0

收录在圈子:

华章出版社

709

+ 订阅

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

矩阵账号批量直播，单套软件最多能同时运营几个账号？

能不能靠谱点？每天更新，自己发现不了问题？测试人员都栽了吗？

完全没有直播经验，上手 AI 直播需要多久？

动态变量话术引擎对直播有什么作用？

在vs code安装Qoder CN，登录并订阅了个人专业版，无法使用，急急急

相关文章

多模数据库是什么？支持哪些数据模型、能不能用 SQL 查询？阿里云 Lindorm 解析

车企智能驾驶数据底座首选：阿里云 PolarDB 高并发实时处理实践

向量数据上千万后 TopK 召回延迟飙到秒级？阿里云 Lindorm 向量引擎调优实战

分布式事务怎么保证一致性？2PC 与 TSO 详解 —— 阿里云 PolarDB-X 强一致分布式事务实践

分布式 JOIN 怎么优化？下推、广播、Co-located JOIN 实战 —— 阿里云 PolarDB-X

还有其他疑问?