文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

大佬们，我实时需求需要查询离线hive表，这个怎么办?只能hive关联hbase?然后去查?

大佬们，我实时需求需要查询离线hive表，这个怎么办?只能hive关联hbase?然后去查?

展开

收起

圆葱猪肉包 2023-03-27 14:13:03 432 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

凌云Cloud

发表文章、提出问题、分享经验、结交志同道合的朋友

最好的方式及基于流批一体化计算引擎，如Flink、Spark，将 Hive 表中的数据实时读取到流式计算引擎中进行处理和查询。

可以使用 Flink 的 Table API 或 SQL API 通过 JDBC 或 Hive Catalog 将 Hive 表加载到 Flink 的内存中，并将其转换为 Flink 的 Table。然后，可以使用 Flink 的 Table API 或 SQL API 对 Hive 表进行实时查询和处理，例如聚合、过滤等。

如果需求是需要实时查询 Hive 表的历史数据，可以将 Hive 表的数据导入到 HBase 中，然后使用 HBase 提供的实时查询能力进行查询。不过这种方案需要考虑数据同步和一致性等问题，比较复杂。

2023-03-27 17:32:48

赞同展开评论

问答分类：

SQL 分布式数据库 HIVE Hbase 云数据库 HBase 版实时计算 Flink版

问答标签：

云数据库 HBase 版hive Hive表 hive云数据库 HBase 版 Hive hbase 查询Hive

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

在Flink CDC中这种方式必须是hive的用户创建的表，创建的hdfs文件才能挂载没有其他方法?

209

0

0

Hologres是否支持查询hive表

229

1

0

Hive如何访问高安全EMR HBase

151

1

0

为什么StarRocks On Hive的查询性能比Trino On Hive好，但比本地存储查询差

595

1

0

StarRocks Hive外表查询在TPCH 100G数据集上的总耗时是多少？

238

1

0

StarRocksOnHive和TrinoOn Hive查询的是哪一份数据，数据是如何存储和压缩的？

222

1

0

我如何将一个oss 挂载到emr集群。以便通过hive sql 查询oss 里的日志数据？

243

0

0

DataWorks通过脚本模式配置离线同步任务，从Hive同步数据到HBase，是参数位置不对吗？

221

1

0

E-MapReduce在beeline访问thriftserver执行sql查询hive数据报错

249

1

0

请教一个问题。我在用spark读取hbase数据时，默认是一个regoin一个task。发现有些re

1352

0

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

海量宽表存储首选：阿里云 Lindorm 兼容 HBase 且更省成本

很多 Agent 最后变成聊天框，问题出在哪？

电商平台数据库TDE透明加密实战：防数据泄露+合规一次过

AI时代的知识重构：Google Cloud OKF规范如何破解RAG痛点，重塑Agent知识库协作

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink CDC 能适配达梦不？

有用flink cdc同步mysql到hive这样搞过的源码吗?

flink1.19和hive3.1.3，cdc从mysql同步数据到hive，插入时报错？

flinkcdc在IDEA运行正常，打包就报错

Flink CDC里这个问题怎么解决？

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

那cdc最新版支持到flink的哪个版本，flink1.15还有guava兼容性问题吗？

在Flink想实时汇总数据，类似数据大屏功能，应该用阿里云Flink的什么功能服务？

如何用实时数据同步打破企业数据孤岛？

展开全部

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

回顾 | Kafka x Flink Meetup 与世界人工智能大会大数据 AI 专场精彩回顾（附PPT下载）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

广告场景下的实时计算

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

如何在 PyFlink 1.10 中自定义 Python UDF？

展开全部

还有其他疑问?