文档备案控制台

开发者社区问答正文

数据湖中面向对象存储分析的问题有哪些？

数据湖中面向对象存储分析的问题有哪些？

展开

收起

游客qzzytmszf3zhq 2021-12-09 19:46:02 600 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客yzrzs5mf6j7yy

对象存储相比HDFS为了保证高扩展性，在元数据管理方面选择的是扁平的方式；元数据管理没有维护目录结构，因此可以做到元数据服务的水平扩展，而不像HDFS的NameNode会有单点瓶颈。同时对象存储相比HDFS可以做到免运维，按需进行存储和读取，构建完全的存储计算分离架构。但是面向分析与计算也带来了一些问题：

List慢：对象存储按照目录/进行list相比HDFS怎么慢这么多？请求次数过多：分析计算的时候怎么对象存储的请求次数费用比计算费用还要高？ Rename慢：Spark、Hadoop分析写入数据怎么一直卡在commit阶段？读取慢：1TB数据的分析，相比自建的HDFS集群居然要慢这么多！

2021-12-09 20:00:47

赞同展开评论

问答分类：

对象存储对象存储

问答标签：

数据湖分析数据湖存储数据湖存储分析

问答地址：

开发者社区 > 云计算 > 问答

相关问答

什么是数据湖分析

218

1

0

在数据湖上进行极速分析通常包括哪些核心模块？

137

1

0

数据湖是如何满足企业数据存储和安全需求的？

162

1

0

阿里云E-MapReduce数据湖分析和存算分离都支持湖上建仓和仓下沉到湖么？

270

0

0

阿里云E-MapReduce用存算分离模式是不是也可以进行数据湖分析？

273

1

0

阿里云E-MapReduce 数据湖分析版和存算分离版有什么区别？

225

1

0

数据量比在线的表格存储少了一个数量级，什么原因？

347

1

0

数据湖存储方案Lakehouse架构是什么？

857

1

0

数据湖中分析数据的产品DataWorks的作用包括哪些？

556

1

0

云原生数据湖分析的核心组件有哪些？

750

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

Qoder Work是个好家伙，但是什么时候能支持自定义模型API？

idea qoder cn报错

相关文章

阿里云快照是什么？快照收费吗？云服务器ECS快照价格多少钱？

阿里云服务器ECS的【快照】是什么意思？收费吗？

基于 YOLO11 的工业厂区泄漏隐患检测：从数据标注到云上训练工程实践

OSS + CDN + 数据万象：亿级图片处理架构从0到1的完整实战

基于YOLO11的快递包裹纸箱检测：从数据标注到云上训练全流程实践

相关解决方案

更多

SelectDB实现日志高效存储与实时分析

精准分析检索，打造商品推荐体验

分析 Agent 实现一键 AI 数据洞察

高效存储和处理多媒体数据

云原生企业级数据湖

还有其他疑问?