学习中心> Hadoop 分布式资源管理框架 YARN> 正文

Hadoop 分布式资源管理框架 YARN

5课时 |
255人已学 |
免费
课程介绍

课程大纲

  • YARN基本架构
  • YARN工作机制
  • YARN作业提交全流程
  • YARN资源调度器
  • YARN任务推测执行

YARN资源调度器

 

一、资源调度器

目前,Hadoop 作业调度器主要有三种: FIFO、Capacity Scheduler和Fair Scheduler。

Hadoop2.7.2 默认的资源调度器是Capacity Scheduler。

具体设置详见:yarn-default.xml文件。

 

(1)先进先出调度器(FIFO)

1、job按照到达时间排序,先到先服务

2、有新的服务器节点资源

3、Job1里面包含4个MapTask和2个ReduceTask

4、分配一个Task给该节点

 

(2)容量调度器

1、支持多个队列,每个队列可配置一定的资源量,每个队列采用FIFO调度策略。

2、为了防止同一个用户的作业独占队列中的资源,该调度器会对同一用户提交的作业所占资源量进行限定。

3、首先,计算每个队列中正在运行的任务数与其应该分得的计算资源之间的比值,选择一个该比值最小的队列——最闲的。

4、其次,按照作业优先级和提交时间顺序,同时考虑用户资源量限制和内存限制对队列内任务排序。

5、三个队列同时按照任务的先后顺序依次执行,比如,job11、job2 1和job31分别排在队列最前面,先运行,也是并行运行。

 

(3)公平调度器

  • 支持多队列多用户,每个队列中的资源量可以配置,同一队列中的作业公平共享队列中所有资源。

 

  • 比如有三个队列:queueA、queueB和queueC ,每个队列中的job按照优先级分配资源,优先级越高分配的资源越多,但是每个job都会分配到资源以确保公平。

 

  • 在资源有限的情况下,每个job理想情况下获得的计算资源与实际获得的计算资源存在一种差距,这个差距就叫做缺额。

 

4、在同一个队列中,job的资源缺额越大,越先获得资源优先执行。作业是按照缺额的高低来先后执行的,而且可以看到上图有多个作业同时运行。

 

我的学习进度
请登录后查看您的学习进度!
立即登录
本课程相关云产品