请教一个HBase表热点问题:假如有一个宽表,其中某一行的数据很大,有数百万列,数据量也已经超过了Region的大小,如果该行数据成为读写的热点,对于这种情况应该怎么处理?
不建议有单行数据过大的宽表设计,原因是: 1. hbase split是以region为单位。单行数据过大会导致无法split 2. hbase 客户端-服务端传输协议不支持单行内的流式传输,当读取该热点row时,row size可能大于hbase的rpc传输包大小限制,导致数据读不出来。
建议修改方式: 将表设计从宽表改造成高表。将列名(qualifier)拼接到rowkey上,用多行替换单行
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。