备案控制台

开发者社区问答正文

Apache Hadoop是什么？

Apache Hadoop是什么？

展开

收起

芯在这 2021-12-07 11:39:50 523 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

　Apache Hadoop是一种专用于批处理的处理框架。Hadoop是首个在开源社区获得极大关注的大数据框架。基于谷歌有关海量数据处理所发表的多篇论文与经验的Hadoop重新实现了相关算法和组件堆栈，让大规模批处理技术变得更易用。

　　新版Hadoop包含多个组件，即多个层，通过配合使用可处理批数据：

HDFS：HDFS是一种分布式文件系统层，可对集群节点间的存储和复制进行协调。HDFS确保了无法避免的节点故障发生后数据依然可用，可将其用作数据来源，可用于存储中间态的处理结果，并可存储计算的最终结果。

YARN：YARN是Yet Another Resource Negotiator（另一个资源管理器）的缩写，可充当Hadoop堆栈的集群协调组件。该组件负责协调并管理底层资源和调度作业的运行。通过充当集群资源的接口，YARN使得用户能在Hadoop集群中使用比以往的迭代方式运行更多类型的工作负载。

MapReduce：MapReduce是Hadoop的原生批处理引擎。

2021-12-07 12:14:02

赞同展开评论

问答分类：

分布式计算 Hadoop Apache

问答标签：

Apache hadoop hadoop apache

问答地址：

开发者社区 > 大数据 > 问答

相关问答

E-MapReduce中出现Apache Hadoop FileUtil.unTar命令注入漏...

87

1

0

原生Apache Hadoop使用MapReduce整合odps读取MaxCompute表数据...

96

0

0

E-MapReduce漏洞修复Apache Log4j2，Apache Hadoop？

340

1

0

开源大数据平台Apache Hadoop FileUtil.unTar命令注入漏洞如何处理

448

1

0

E-MapReduce中出现Apache Hadoop FileUtil.unTar命令注入漏洞如何

329

1

0

为什么Apache Hadoop的系统中有较高的可靠性呢？

1834

1

0

一个Apache Hadoop项目包括哪些板块呢？

1741

1

0

Apache Hadoop软件库是依靠硬件去实现的高可用性嘛？

1848

1

0

Apache Hadoop软件库只有一台单一服务器么？

2020

1

0

Apache Hadoop软件库是什么呀？

1783

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

阿里云服务器双十一活动多少钱？

通义灵码ide插件2.6.4版本是不是换模型了，现在用的模型是什么？

阿里云双十一优惠活动开始了吗？今年2025年的

阿里云双十一优惠活动开始了？2025年的是这个吗？

无法使用dd.canIUse接口、dd.httpRequest，根本找不到

相关文章

别再靠“经验救火”了：用运维数据 + 机器学习，让系统自己告诉你问题在哪

当数据湖遇上数据仓库：不是对立，而是走向“湖仓一体”的未来

阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX

分布式事务新方案：Saga 与 TCC 在 Java 生态的融合实践

PySpark实战：亿级爬虫数据的高效处理指南

还有其他疑问?