文档备案控制台

开发者社区数据库数据仓库正文

Hudi 在不依赖Flink 和 Spark 的情况是否还有其他方式可以查询hudi的数据

hudi入门小白，Hudi 在不依赖Flink 和 Spark 的情况是否还有其他方式可以查询hudi的数据，通过hudi-cli 查询到的好像只能查看一些提交信息和元数据(可能是我打开方式不对), 各位大佬有什么好的推荐？

展开

收起

游客6ywpin3m6tto4 2023-08-16 22:35:37 269 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

我已经认真阅读了你的问题：【其他方式可以查询hudi的数据】

并思考了查询方法

建议如下:

使用Hudi提供的其他工具或API来进行查询

Hudi CLI：你已经提到了Hudi CLI，它是一个命令行工具，可以用于查询和管理Hudi表的元数据信息。除了查看提交信息和元数据外，你还可以使用Hudi CLI执行一些简单的查询操作，例如基于时间范围的查询。你可以尝试使用不同的命令和选项来获取更多有关数据的信息。

Hudi API： Hudi还提供了Java和其他编程语言的API，你可以使用这些API直接与Hudi进行交互，查询和操作数据。通过使用Hudi的查询API，你可以编写代码来执行更复杂的查询操作，例如根据条件过滤、聚合等。这需要你有一定的编程知识和对Hudi API的理解。

使用其他工具：除了Hudi本身提供的工具和API，你还可以考虑使用其他数据查询工具来访问Hudi数据。例如，你可以使用Apache Hive、Presto或类似的工具，通过定义外部表的方式来访问Hudi数据。这种方式可能需要一些配置和集成工作，但可以让你使用更广泛的查询工具和语法来查询Hudi数据。

2023-08-18 19:06:05

赞同展开评论

问答分类：

分布式计算流计算 Spark 实时计算 Flink版

问答标签：

实时计算 Flink版数据 apache spark依赖 apache spark数据 apache spark flink 实时计算 Flink版依赖

问答地址：

开发者社区 > 数据库 > 数据仓库 > 问答

相关问答

在Flink CDC中请问运行官网的代码报这个问题，是缺少什么依赖吗？

207

1

0

在Flink CDC中还要在配个MySQL Connector依赖吗？

209

1

0

开发指南Flink，依赖的jar在maven仓库删除了

336

0

0

flink里pyspark ,通过 spark-submit 这种方式提交作业，报错依赖缺失咋办？

298

1

0

dataworks上如何开发实时任务 spark任务或者flink任务？

224

0

0

在Flink CDC中，flinsql读spark表的timestamp类型字段报这个错，这个咋解决

186

0

0

为什么选择从Kafka + Spark Streaming转向Flink？

224

1

0

要在DataWorks上同时使用EMR Spark和Flink应用，应该怎么选择技术架构？

259

0

0

Flink CDC是不是sqlserver动态加表有bug还是有依赖没引入进来？

203

0

0

在DMS中是否有单独执行Spark SQL预览查询结果的功能，而不是执行整个任务并写入表？

279

1

0

数据库

数据仓库

阿里云自主研发的云原生数据仓库，具有高并发读写、低峰谷读写、弹性扩展、安全可靠等特性，可支持PB级别数据存储，可广泛应用于BI、机器学习、实时分析、数据挖掘等场景。包含AnalyticDB MySQL版、AnalyticDB PostgreSQL 版。

我要提问

相关文章

Search Lake：ES x Paimon 让湖上多模态数据可搜可用

阿里云实时计算Flink版对接实战：从数据源到结果表的全链路开发指南

阿里云数据总线DataHub深度对接实战指南：从入门到生产级管道构建

广告竞价为什么要拼毫秒级速度？揭秘 RTB 实时广告系统背后的数据流水线设计

告别干扰困扰！RFID手持机在复杂仓储中的可靠表现

相关解决方案

更多

基于数据闪回，快速恢复数据

PolarDB 列存索引加速复杂查询

海量异构数据预处理破局之道

高效存储和处理多媒体数据

分析 Agent 实现一键 AI 数据洞察

热门讨论

热门文章

ADB官方支持有一张镜像表不小心把数据删掉了，怎么样重新同步回来？

云数据仓库ADB订单客户库存商品表都用月份分区数据结构上是月份分片下订单、客户、库存、商品表吗？

云数据仓库ADB多张表合成一个表时候提示Unexpected token 如何优化？

云数据仓库ADB jdbc 连接串的映射信息是否可以获取到？

云数据仓库ADB里怎么查看创建的分区表的分区信息？

云数据仓库ADB如何在AnalyticDBMySQL版中对分组聚合查询进行优化通过Hint优化分组？

DMS中，昨天晚上任务重复调度的，有没有办法快速判断任务SQL业务逻辑是否幂等？

AnalyticDB PostgreSQL版通过安全可靠测评了吗？

ADB显示已经没有正在执行的查询，但是为什么CPU还是那么高？

云数据仓库ADB中我的分布键是id 为啥单表查时候提示数据倾斜啊？

展开全部

扫码点餐小程序搭建流程详解：从桌码到订单系统如何实现

直播带货系统搭建全流程拆解：私域直播如何实现稳定变现

AgenticDB：源自阿里云AnalyticDB，为AI-Native企业而生

外卖配送系统搭建方法核心：调度算法与任务分配机制实现思路

互联网医院AI问诊系统架构设计：从智能分诊到在线诊疗的完整链路

知识付费开发实战：如何用一套系统完成招生 + 成交 + 复购

一键实现穿衣自由，揭秘淘宝AI试衣间硬核技术，AnalyticDB向量在线召回

互联网医院开发系统如何对接医保支付与电子处方平台

AI问诊系统开发架构解析：大模型 + 医疗知识库如何落地

兼顾高性能与低成本，浅析 Apache Doris 异步物化视图原理及典型场景

展开全部

还有其他疑问?