开发者社区> 问答> 正文

解决hbase自动处理region拆分出现问题的方法是什么?

解决hbase自动处理region拆分出现问题的方法是什么?

展开
收起
游客fbdr25iajcjto 2021-12-09 20:51:11 562 0
1 条回答
写回答
取消 提交回答
  • 为了解决这些问题,预分区就是一种很好的方法,通常它和加盐结合起来使用。

    所谓预分区,就是预先创建hbase表分区。这需要我们明确rowkey的取值范围和构成逻辑。

    比如前面我们所列举的电信电话详单表。通过加盐我们得到的 rowkey构成是:随机数+主叫+被叫+时间,如果我们现在并没有500台机器,只有10台,但是按照我们的计划,未来将扩展到500台的规模。所以我们仍然设计0到499的随机数,但是将以主叫177开头的通话记录分配到十个region当中,所以我们将随机数均分成十个区域,范围如下:

    -50,50-100,100-150,150-200,200-250,250-300,300-350,350-400,400-450,450- 然后我们将我们的预分区存入数组当中,当插入数据时,先根据插入数据的首部随机数,判断分区位置,再进行插入数据。同样,这样也能使得各台节点负载均衡。

    2021-12-09 20:51:54
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据时代的存储 ——HBase的实践与探索 立即下载
Hbase在滴滴出行的应用场景和最佳实践 立即下载
阿里云HBase主备双活 立即下载