开发者社区> 问答> 正文

[@徐雷frank][¥20]HBase的rowkey 和 列族设计要遵循哪些规则

有时候用了 md5 ,数据分布还是很集中。是(id+时间)的md5 还是 时间戳md5+id,有时候会按时间段往出拉数据。

展开
收起
图拉丁8 2018-11-22 15:40:09 2164 0
2 条回答
写回答
取消 提交回答
  • 1.阿里云大学讲师,主讲《微服务Spring Cloud设计与开发实战》《MongoDB高级实战》等课程 2.MongoDB中文社区专家 3.《MongoDB实战》第2版译者 5.吉林大学计算机科学学士、上海交通大学硕士

    1、按照时间段拉去数据,可以考虑时间在前,本来的ID不知道是什么类型。
    2、MD5哈希,组合也不好查询,无法提升范围查询的效率
    3、考虑使用辅助索引来实现,基于时间的范围查询。

    2019-07-17 23:15:57
    赞同 展开评论 打赏
  • 研究spark/hive/hbase相关技术

    可以参考阿里云HBase官网,对于rowkey设计讲解的很完善。
    https://help.aliyun.com/document_detail/59035.html?spm=a2c4g.11186623.6.574.415333e0ZlzbGE

    2019-07-17 23:15:57
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
大数据时代的存储 ——HBase的实践与探索 立即下载
Hbase在滴滴出行的应用场景和最佳实践 立即下载
阿里云HBase主备双活 立即下载