YARN-架构

简介:

标签(空格分隔): 大数据 YARN


[toc]


原文:http://hadoop.apache.org/docs/r2.6.4/hadoop-yarn/hadoop-yarn-site/YARN.html

Hadoop下一代MapReduce(YARN)

MapReduce在hadoop-0.23中经历了完整的革新,也就是引入了MapReduce 2.0(MRv2),俗称YARN。

MRv2的核心思想是将原来JobTracker的两个主要功能拆分,也就是将资源管理(resource management)和调度与监控(scheduling/monitoring)分离为两个daemon进程。其思想表现为持有一个全局的ResourceManager(RM)以及每个应用有一个ApplicationMaster(AM)。一个应用对应一个传统的MR作业或者一个作业组DAG。

ResourceManager和每个slave节点的NodeManager(NM)构成了数据计算框架。ResourceManager是全局总控,负责分配仲裁系统中作业的资源。

ApplicationMaster是每个应用作业一个,它事实上是一个框架相关的lib库,被用来和ResourceManager协调资源以及与NodeManager协同工作来执行和监控任务。

MapReduce NextGen Architecture

ResourceManager有两个主要组件:调度器Scheduler和应用管理器ApplicationsManager。

调度器Scheduler负责给每个不同的运行中的作业分配资源,使其满足容量约束和队列约束等。Scheduler是纯粹的调度器,不做任何应用的监控和状态跟踪。同理,也不保证失败任务的重启,无论是应用程序错误还是硬件错误。调度器根据应用作业的资源需求来完成调度;它基于抽象的资源容器来工作,抽象资源包括内存、cpu、磁盘、网络等等。在第一个版本中,只支持内存。

调度器有一个可插拔的策略插件,它负责在不同队列和应用作业中划分集群资源。当前的MapReduce调度器例如CapacityScheduler和FairScheduler就是类似的插件。

CapacityScheduler支持层级队列从而允许更多可预测的集群资源共享。

ApplicationsManager负责接受作业提交,同时负责协商用来执行ApplicationMaster相关的应用程序的容器,还提供服务来支持在失败时重启ApplicationMaster容器。

NodeManager是每台机器上的框架agent,它负责支持容器,监控资源使用情况(cpu、内存、磁盘和网络)以及把这些情况报告给ResourceManager和Scheduler。

ApplicationMaster也负责从Scheduler协调合适的资源容器,同时跟踪它们的状态和监控它们的过程。

MRv2保持了与hadoop-1.x的API兼容性。这意味着所有的MapReduce作业都可以不做变更的运行在YARN上,要做的事情只有一次重新编译而已。

目录
相关文章
|
资源调度 分布式计算 监控
|
2月前
|
资源调度 分布式计算 Hadoop
YARN(Hadoop操作系统)的架构
本文详细解释了YARN(Hadoop操作系统)的架构,包括其主要组件如ResourceManager、NodeManager和ApplicationMaster的作用以及它们如何协同工作来管理Hadoop集群中的资源和调度作业。
88 3
YARN(Hadoop操作系统)的架构
|
3月前
|
资源调度 分布式计算 监控
【揭秘Hadoop YARN背后的奥秘!】从零开始,带你深入了解YARN资源管理框架的核心架构与实战应用!
【8月更文挑战第24天】Hadoop YARN(Yet Another Resource Negotiator)是Hadoop生态系统中的资源管理器,为Hadoop集群上的应用提供统一的资源管理和调度框架。YARN通过ResourceManager、NodeManager和ApplicationMaster三大核心组件实现高效集群资源利用及多框架支持。本文剖析YARN架构及组件工作原理,并通过示例代码展示如何运行简单的MapReduce任务,帮助读者深入了解YARN机制及其在大数据处理中的应用价值。
78 0
|
5月前
|
资源调度 分布式计算 监控
YARN的基本架构
【6月更文挑战第19天】YARN的基本架构
112 10
|
6月前
|
分布式计算 资源调度 Spark
Spark的一些问题汇总 及 Yarn与Spark架构的对比
Spark的一些问题汇总 及 Yarn与Spark架构的对比
67 0
|
6月前
|
资源调度 分布式计算 Hadoop
【Hadoop Yarn】YARN 基础架构分析
【4月更文挑战第7天】【Hadoop Yarn】YARN 基础架构分析
|
6月前
|
资源调度 分布式计算 Hadoop
Apache Hadoop YARN基本架构
【2月更文挑战第24天】
|
6月前
|
资源调度 分布式计算 监控
Hadoop中的YARN是什么?请解释其作用和架构。
Hadoop中的YARN是什么?请解释其作用和架构。
138 0
|
资源调度 调度 容器
YARN核心架构
YARN核心架构
51 0
|
资源调度 容器
yarn基本架构和工作机制
yarn基本架构和工作机制
86 0
yarn基本架构和工作机制