开发者社区 > 数据库 > 数据仓库 > 正文

Hudi 在不依赖Flink 和 Spark 的情况是否还有其他方式可以查询hudi的数据

hudi入门小白,Hudi 在不依赖Flink 和 Spark 的情况是否还有其他方式可以查询hudi的数据,通过hudi-cli 查询到的好像只能查看一些提交信息和元数据(可能是我打开方式不对), 各位大佬有什么好的推荐?

展开
收起
游客6ywpin3m6tto4 2023-08-16 22:35:37 111 0
1 条回答
写回答
取消 提交回答
  • 北京阿里云ACE会长

    我已经认真阅读了 你的问题: 【 其他方式可以查询hudi的数据 】

    并思考了 查询方法

    建议如下:


    使用Hudi提供的其他工具或API来进行查询

    Hudi CLI: 你已经提到了Hudi CLI,它是一个命令行工具,可以用于查询和管理Hudi表的元数据信息。除了查看提交信息和元数据外,你还可以使用Hudi CLI执行一些简单的查询操作,例如基于时间范围的查询。你可以尝试使用不同的命令和选项来获取更多有关数据的信息。

    Hudi API: Hudi还提供了Java和其他编程语言的API,你可以使用这些API直接与Hudi进行交互,查询和操作数据。通过使用Hudi的查询API,你可以编写代码来执行更复杂的查询操作,例如根据条件过滤、聚合等。这需要你有一定的编程知识和对Hudi API的理解。

    使用其他工具: 除了Hudi本身提供的工具和API,你还可以考虑使用其他数据查询工具来访问Hudi数据。例如,你可以使用Apache Hive、Presto或类似的工具,通过定义外部表的方式来访问Hudi数据。这种方式可能需要一些配置和集成工作,但可以让你使用更广泛的查询工具和语法来查询Hudi数据。

    2023-08-18 19:06:05
    赞同 展开评论 打赏

阿里云自主研发的云原生数据仓库,具有高并发读写、低峰谷读写、弹性扩展、安全可靠等特性,可支持PB级别数据存储,可广泛应用于BI、机器学习、实时分析、数据挖掘等场景。包含AnalyticDB MySQL版、AnalyticDB PostgreSQL 版。

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载