YARN中的资源调度

简介: 【6月更文挑战第19天】YARN中的资源调度

YARN中的资源调度

YARN 通过资源调度器、资源表示模型、增量资源分配机制、层级队列管理和多种调度策略等实现资源调度。在 YARN(Yet Another Resource Negotiator)中,有效的资源调度是确保 Hadoop 集群高效运行的关键。下面将详细探讨 YARN 中的资源调度机制:

  1. 资源调度器
    • 基本架构:YARN 的资源调度器是 ResourceManager 的一个可插拔组件[^3^]。它负责整个集群资源的管理和分配,采用双层资源调度模型:第一层由 RM 将资源分配给 AM(应用程序管理器),第二层由 AM 进一步将资源分配给内部任务[^2^][^3^]。
    • 调度策略:YARN 提供了三种常用的调度器:FIFO (先进先出)、Capacity Scheduler (容量调度器) 和 Fair Scheduler (公平调度器)[^1^][^3^]。每种调度器适用于不同的场景,如 FIFO 适用于简单场景,容量调度器适用于多租户环境,公平调度器强调资源分配的公平性[^1^][^3^]。
  2. 资源表示模型
    • 节点注册:NodeManager (NM) 向 ResourceManager (RM) 注册时,会报告该节点可分配的 CPU 和内存总量[^4^]。这些值可通过配置选项设置,例如 yarn.nodemanager.resource.memory-mb 和 yarn.nodemanager.resource.cpu-vcores[^4^]。
    • 资源请求:YARN 支持丰富的资源请求语义,包括特定节点或机架上的资源请求、黑名单机制以及资源归还请求。不支持任意节点或机架上的特定资源量请求及超细粒度资源要求[^4^]。
  3. 增量资源分配机制
    • 资源保证:当单个节点的闲置资源无法满足应用需求时,YARN 采用增量资源分配机制,预留部分资源直到累计释放的空闲资源满足应用程序需求。这种机制虽然可能造成一定资源浪费,但避免了应用程序“饿死”现象[^4^]。
  4. 层级队列管理
    • 队列结构:YARN 的队列是层级关系,每个队列可以包含子队列,用户只能将任务提交到叶子队列。管理员可以配置每个队列的资源保证和使用上限,并设置严格的 ACL 列表限制提交应用程序的权限[^4^]。
  5. 调度器详解
    • FIFO:按提交顺序将应用排成一个队列,简单但不适合共享集群[^1^][^3^]。
    • Capacity Scheduler:为每个队列设定资源保证和使用上限,支持资源共享和多租户管理,适合大规模集群[^1^][^3^]。
    • Fair Scheduler:旨在为所有应用分配公平的资源,不需要预先占用资源,为所有运行的作业动态调整系统资源[^1^][^3^]。

综上所述,YARN 通过灵活的资源调度器、详细的资源表示模型和有效的增量资源分配机制,实现了强大而灵活的资源调度能力。选择适合自己需求的任务调度器并优化资源配置是提高计算效率的关键。

目录
相关文章
|
9月前
|
资源调度 分布式计算 Java
Yarn资源调度器
Yarn资源调度器
48 0
|
12天前
|
资源调度 分布式计算 Hadoop
YARN中的资源调度主要通过其调度器(Scheduler)实现
【6月更文挑战第20天】YARN中的资源调度主要通过其调度器(Scheduler)实现
27 5
|
9月前
|
SQL 资源调度 分布式计算
聊聊 yarn 的三种资源调度器和公平调度器的最佳配置实践
聊聊 yarn 的三种资源调度器和公平调度器的最佳配置实践
|
存储 分布式计算 资源调度
Yarn的基本概念与资源调度
Hadoop是Apache的一个开源分布式计算平台,以分布式文件系统HDFS,和MapReduce为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。HDFS的高容错性、高伸缩性等优点形成分布式系统;MapReduce分布式编程模型让我们开发并行应用程序。
|
资源调度 分布式计算 监控
工作常用之Yarn详解【五】资源调度与隔离
在YARN中,资源管理由ResourceManager和NodeManager共同完成,其中,ResourceManager中的调度器负责资源的分配,而NodeManager则负责资源的供给和隔离。
601 0
工作常用之Yarn详解【五】资源调度与隔离
|
资源调度 分布式计算 Hadoop
CDP中Yarn资源调度与管理
您可以通过调度分配资源、通过配置 cgroup 限制 CPU 使用、使用分区将集群划分为子集群以及在 Docker 容器上启动应用程序来管理集群上运行的应用程序的资源。
796 0
|
资源调度 大数据 容器
史上最快! 10小时大数据入门实战(四)-分布式资源调度YARN
1 YARN 产生背景 2 YARN 架构 3 YARN 执行流程 1.
1366 0
|
资源调度 分布式计算 监控
|
资源调度 数据库管理
|
2月前
|
资源调度 分布式计算 Hadoop
Hadoop Yarn 核心调优参数
这是一个关于测试集群环境的配置说明,包括3台服务器(master, slave1, slave2)运行CentOS 7.5,每台有4核CPU和4GB内存。集群使用Hadoop 3.1.3,JDK1.8。Yarn核心配置涉及调度器选择、ResourceManager线程数、节点检测、逻辑处理器使用、核心转换乘数、NodeManager内存和CPU设置,以及容器的内存和CPU限制。配置完成后,需要重启Hadoop并检查yarn配置。