文档备案控制台

开发者社区问答正文

Hadoop 的局限性有哪些？

Hadoop 的局限性有哪些？

展开

收起

Medusa 2022-01-13 18:27:03 1727 版权

来自：开发者社区官方技术圈

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

云上静思
Hadoop 自身存在着一定的局限性，包含4点：
1. 时效性低 Hadoop 是高吞吐量的系统，不适合低延时的交互式数据访问，如实时返回结果数据就是 Hadoop 目前不能做到的。
2. 不适合存储大量的小文件 Hadoop 适合存储大文件，而不适合存储大量的小文件。因为 NameNode 会将元数据信息存储在内存中，Hadoop 存储大量的小文件会大量占用 NameNode 的内存，导致 Hadoop的存储受限于 NameNode 的内存大小，极大地限制了 Hadoop 的存储空间。
3. 不支持任意修改文件 Hadoop 不支持对文件的任意修改，但是可以对文件进行追加操作，适合一次写入，多次读取。
4. 不支持多人同时进行写操作 Hadoop不支持多人同时进行写操作，在某一时刻，只能有一个人对Hadoop执行写操作。
以上内容摘自《海量数据处理与大数据技术实战》电子书，点击https://developer.aliyun.com/topic/download?id=8205可下载完整版
2022-01-13 20:33:58

赞同展开评论

问答分类：

分布式计算 Hadoop

问答地址：

开发者社区 > 开发者社区官方技术圈 > 问答

相关问答

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

136649

16

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11206

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

268479

11

0

#支付宝授权提示请在支付宝客户端打开链接

18869

19

0

购买阿里国外的云服务器是否可以访问谷歌？

87391

49

0

this xml file does not appear to have any style in

55022

11

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35695

17

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

3178

18

0

轻量级应用服务器端口问题（打不开）

32354

21

0

LoRa的网络覆盖能力范围是怎么样的？

4280

1

0

收录在圈子:

开发者社区官方技术圈

70151

+ 订阅

阿里云开发者社区官方技术圈，用户产品功能发布、用户反馈收集等。

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

相关文章

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

Dataphin功能Tips系列（92）如何方便快速地通过SQL取数实现定制化数据同步

阿里云第九代ECS云服务器（c9i、g9i、r9i）CPU采用Intel® Xeon® Granite Rapids处理器，主频3.2 GHz

别再盲目上 Serverless 了：聊聊 Serverless 数据分析的真相、成本和适用场景

还有其他疑问?