开发者社区> 问答> 正文

impala+hive+hbase

通过HIVE创建hbase的外部表,impala再关联hive进行实时查询,但查询hive关联的hbase表太慢太慢,比impala+kudu要慢10倍左右,就希望能否在hive关联hbase的外部表建立索引,请问如果创建才能生效,提高查询速度?

展开
收起
戴雄辉 2018-11-23 15:17:00 4930 0
2 条回答
写回答
取消 提交回答
  • 1、hbase本身是行存,比较适合简单查询的高效率和并发 2、对于想要做实时分析,建议把hbase的数据归档到parquet,或者kudu然后使用impala

    2020-03-21 17:21:40
    赞同 展开评论 打赏
  • 研究spark/hive/hbase相关技术

    hive不支持创建hbase二级索引的。
    目前阿里也有类似的解决方案,采用spark+phoenix的方案。
    phoenix支持HBase二级索引,能够加速HBase复杂查询场景,对于多表复杂分析则用spark分析phoenix,也能够利用二级索引提升分析性能。

    2019-07-17 23:16:14
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hive Bucketing in Apache Spark 立即下载
spark替代HIVE实现ETL作业 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载