开发者社区> 问答> 正文

为什么说要把列族数据量不要太多呢?

为什么说要把列族数据量不要太多呢?

展开
收起
游客fbdr25iajcjto 2021-12-06 20:09:00 517 0
1 条回答
写回答
取消 提交回答
  • regionserver管理着多个region,每个region中有多个hstore组成,每个hstore对应表中的column family中的存储,hstore是hbase存储的核心,由memstore和stroefile组成,当memstore满了之后会flush到storefile中.

    region下面的某个storefile过大之后,就会进行split操作. 多个列族会形成更多的hfile小文件 不同列族会共享region,split操作会导致io增加. 一个列族触发flush时,其它列族也会进行flush,导致io压力增加 会形成更多小文件,增加hdfs压力 查询CF时,会出现跨多个region,查询效率变低 多个CF会有多个Memstore,内存占用增大.

    2021-12-06 20:12:00
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
RowKey与索引设计:技巧与案例分析 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载