问:请问hbase设计表经验总结要注意哪些事项?
答:
主要的基本规则有:
1)Regions的大小定在10~50GB;
2) Cells的大小不要超过10MB,如果要存储中型数据(超过50MB),可以选择将数据存储在HDFS上,然后在HBase中存储引用指针就好;
3) 通常情况下,1个表的列族控制在1~3个,不能模仿关系型数据库的模式;
4) 每个表的regions数量控制在50~100个。请记住region是一段连续的列族;
5) 尽量使列族的名称简短,因为每个值都会存储列族名;
6) 如果存储基于时间的数据或日志数据,row key是基于设备ID或服务ID加时间,这样的模式可能会导致新加的数据都写到新的region,而旧的region则不会被写,形成写热点;
7) 如果只有1个列族,而且还写得比较频繁,那就要注意写的负载均衡。
by__轶俗
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。