文档备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

架构上是把(Parquet、hudi、hdfs、iceberg、oss 等文件系统)全部统一管理么？

展开

收起

雪哥哥 2022-10-30 08:19:00 656 版权

阿里云 AI 助理回答

是的，阿里云数据湖构建（DLF）通过其2.0版本的功能更新，实现了对多种文件系统和数据格式的统一管理。具体来说：

元数据管理：DLF 2.0引入了Hive Catalog，它支持统一的元数据管理，不仅适用于HMS兼容的湖表格式（如Parquet），还直接支持纳管OSS-HDFS和OSS存储，覆盖了Hudi、Iceberg等数据湖格式。
Paimon Catalog增强：DLF 2.0在Paimon Catalog中增加了对外表管理的支持，使得读取外部数据源成为可能，这涵盖了更多如Parquet等存储在不同文件系统上的数据。同时，视图管理和文件目录（Volume）功能也进一步扩展了对文件元数据管理的统一性，包括对用户文件的组织和访问。
数据湖分析能力：StarRocks作为数据湖分析引擎，能够通过External Catalog直接查询存储在Apache Hive、Apache Iceberg、Apache Hudi、Delta Lake等数据湖上的数据，支持包括Parquet、ORC、CSV等文件格式，并且兼容HDFS、S3、OSS等多种存储方式，体现了对数据湖生态中多样文件系统的集成与统一处理能力。

综上所述，无论是通过DLF的Hive Catalog还是Paimon Catalog，或是StarRocks的数据湖分析特性，阿里云技术栈确实旨在实现对Parquet、Hudi、HDFS、Iceberg、OSS等不同文件系统及数据格式的统一管理和高效分析，以促进数据湖架构的整合与优化。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

对象存储实时计算 Flink版对象存储

问答标签：

架构oss 文件存储HDFS版架构架构文件存储HDFS版架构hdfs 对象存储架构

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

阿里云OSS的架构，支持文件语义吗？

258

大数据计算MaxCompute中oss上面的Parquet格式文件支持读取么？

369

阿里函数计算中，函数计算挂载OSS，能否使用文件系统的API写入大文件（几百GB）？有什么限制吗？

337

在你们的湖仓一体架构中，Iceberg是如何与Hive和HDFS集成的？

586

基于Iceberg构建的湖仓一体架构主要解决了Hive数据仓库的哪些痛点？

269

为什么选择Flink和Iceberg来构建实时湖仓一体的架构？

257

JindoFS 和 HDFS 在系统架构上有哪些主要区别？

209

EMR集群3+2部署模式跟之前2+3模式hdfs部署架构有什么区别

216

GlusterFS 分布式文件系统跟Hadoop的hdfs性能和安全性方面的优劣各是什么?

218

MaxCompute中如何把表导出成Hive Parquet文件到oss上

200

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199215

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

当800人团队告别"翻聊天记录找文件"：企业AI知识库的协作效率革命

企业AI知识库：四维价值全景

最新版阿里云 OSS 服务平台功能介绍

架构上是把(Parquet、hudi、hdfs、iceberg、oss 等文件系统)全部统一管理么？

实时计算 Flink

相关文章

相关解决方案

热门讨论

热门文章