通过HIVE创建hbase的外部表,impala再关联hive进行实时查询,但查询hive关联的hbase表太慢太慢,比impala+kudu要慢10倍左右,就希望能否在hive关联hbase的外部表建立索引,请问如果创建才能生效,提高查询速度?
1、hbase本身是行存,比较适合简单查询的高效率和并发 2、对于想要做实时分析,建议把hbase的数据归档到parquet,或者kudu然后使用impala
hive不支持创建hbase二级索引的。
目前阿里也有类似的解决方案,采用spark+phoenix的方案。
phoenix支持HBase二级索引,能够加速HBase复杂查询场景,对于多表复杂分析则用spark分析phoenix,也能够利用二级索引提升分析性能。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。