hudi入门小白,Hudi 在不依赖Flink 和 Spark 的情况是否还有其他方式可以查询hudi的数据,通过hudi-cli 查询到的好像只能查看一些提交信息和元数据(可能是我打开方式不对), 各位大佬有什么好的推荐?
使用Hudi提供的其他工具或API来进行查询
Hudi CLI: 你已经提到了Hudi CLI,它是一个命令行工具,可以用于查询和管理Hudi表的元数据信息。除了查看提交信息和元数据外,你还可以使用Hudi CLI执行一些简单的查询操作,例如基于时间范围的查询。你可以尝试使用不同的命令和选项来获取更多有关数据的信息。
Hudi API: Hudi还提供了Java和其他编程语言的API,你可以使用这些API直接与Hudi进行交互,查询和操作数据。通过使用Hudi的查询API,你可以编写代码来执行更复杂的查询操作,例如根据条件过滤、聚合等。这需要你有一定的编程知识和对Hudi API的理解。
使用其他工具: 除了Hudi本身提供的工具和API,你还可以考虑使用其他数据查询工具来访问Hudi数据。例如,你可以使用Apache Hive、Presto或类似的工具,通过定义外部表的方式来访问Hudi数据。这种方式可能需要一些配置和集成工作,但可以让你使用更广泛的查询工具和语法来查询Hudi数据。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云自主研发的云原生数据仓库,具有高并发读写、低峰谷读写、弹性扩展、安全可靠等特性,可支持PB级别数据存储,可广泛应用于BI、机器学习、实时分析、数据挖掘等场景。包含AnalyticDB MySQL版、AnalyticDB PostgreSQL 版。