备案控制台

开发者社区问答正文

hive on hbase是否可以解决hive修改记录的问题，性能怎么样

hive 的 update 可以使用 kudu 解决，on hbase 的情况不太了解。
1、kudu本身就不成熟，用多了就是坑，国内都没有成熟的案例
2、建议大家用kudu去付费给商业公司或者自己有特别厉害的人
3、全部离线，就直接转化为parquet列存，再spark分析即可

展开

收起

hbase小助手 2018-11-15 13:49:26 2955 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

巴客

研究spark/hive/hbase相关技术

hive on hbase修改记录其实就是先查询出满足条件的数据，然后新写入一条更新列信息的同一rowkey数据，即每次修改都会有读取然后写入，如果过滤列没有没有索引批量读时会scan全表，性能很差。
建议修改数据使用phoenix，对过滤列创建二级索引，加速查询。

2019-07-17 23:14:36

赞同展开评论

问答分类：

SQL 分布式计算分布式数据库 HIVE Spark Hbase 云数据库HBase版

问答标签：

云数据库HBase版hive hive云数据库HBase版 Hive hbase 云数据库HBase版性能

问答地址：

开发者社区 > 数据库 > 问答

相关问答

Hive如何访问高安全EMR HBase

71

1

0

Flink CDC中除了hive有没有那些引擎支持查询hbase的啊？

214

3

0

为什么StarRocks On Hive的查询性能比Trino On Hive好，但比本地存储查询差

375

1

0

DataWorks通过脚本模式配置离线同步任务，从Hive同步数据到HBase，是参数位置不对吗？

111

1

0

请问Flink SQL写Hbase，可以多条写一次吗，提升性能，有参数可以设置吗？

546

4

0

flinkcdc hbase hive 查询报检查hbase副本没问题，大家有知道这个错？

223

0

0

有没有大佬遇见过这个错误。flink查询hive往hbase里面插，过了一会就会报这个错，为什么呢？

536

2

0

大佬们，我实时需求需要查询离线hive表，这个怎么办?只能hive关联hbase?然后去查?

351

1

0

各位，Flink 的离线计算的数据是怎么存放的？是存在 HDFS（或Hive）上的吗？

1818

6

0

flink1.16不支持hive2.1了吗？

865

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云双十一优惠活动开始了？2025年的是这个吗？

钉钉:因安全管控限制,16位参与人无法直接添加到日程

阿里云PAI是什么？怎么用？

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

阿里云2核2G3M适合搭建个人博客或小型项目吗？

相关文章

开源新升级｜体验PolarDB，赢社区礼品

评估工程正成为下一轮 Agent 演进的重点

阿里云大数据AI产品月刊-2025年10月

保姆级教程！DataGrip 2025.1 下载 + 安装 + 激活，小白也能轻松拿捏，附安装包

LangChain 不只是“拼模型”：教你从零构建可编程的 AI 工作流

还有其他疑问?