【Hadoop Yarn】Yarn 调度器分析

简介: 【4月更文挑战第7天】【Hadoop Yarn】Yarn 调度器分析

image.png

yarn 调度器分析

  1. CapacityScheduler(容量调度器)

    • 特点:基于容量划分原则,为不同用户或应用程序分配资源。每个队列都有自己的资源容量,并且可以通过层次结构进行配置。
    • 优势:提供了细粒度的资源管理和灵活的队列配置,适用于多用户多应用程序的场景。
    • 适用场景:适合有明确的资源配额和优先级需求的多租户环境,可以根据业务需求灵活配置不同队列的资源分配策略。
  2. FairScheduler(公平调度器)

    • 特点:致力于实现资源的公平共享,动态地分配资源以平衡各个应用程序之间的资源使用情况。
    • 优势:根据应用程序的需求和当前集群资源的情况进行动态调度,避免资源被某个应用长期占用而导致其他应用无法获得足够资源。
    • 适用场景:适合资源使用不均匀或者希望在多个应用之间实现公平竞争的场景,能够有效地提高集群资源的利用率。
  3. CapacitySchedulerWithMultiQueue(多队列容量调度器)

    • 特点:CapacityScheduler的扩展,支持更灵活的多队列配置,使用户可以更精细地控制资源分配。
    • 优势:提供了更多队列级别的资源控制和管理选项,可以根据具体的业务需求进行更细致的调度策略配置。
    • 适用场景:适合对资源分配有更严格要求的场景,能够灵活地调整不同队列的资源分配比例和优先级,以满足不同应用的需求。
  4. DeadlineScheduler(截止时间调度器)

    • 特点:根据作业的截止时间来进行调度,以确保重要作业能够按时完成。
    • 优势:能够保证重要作业的及时执行,避免由于资源争夺或者其他因素导致作业无法按时完成的情况发生。
    • 适用场景:适合对作业执行时间有严格要求的场景,如实时计算或者业务关键性作业,能够提高作业的可靠性和稳定性。
  5. ProportionalCapacityPreemptionScheduler(比例容量抢占调度器)

    • 特点:在资源不足时,根据队列的优先级和资源使用情况来进行资源抢占,以最大化资源利用率。
    • 优势:能够在资源紧张时智能地进行资源抢占,保证高优先级队列或作业能够获得足够的资源,提高集群资源的利用率。
    • 适用场景:适合在资源竞争激烈的环境中,通过智能的资源抢占策略来优化资源利用,提高整体系统的性能和稳定性。
  6. ReservationSystem(预订系统)

    • 特点:允许用户预先预订集群资源,以确保在未来能够执行特定时间段内的作业。
    • 优势:能够对资源需求进行长期规划,提前预订资源,避免在作业提交时资源不足导致的延迟或者执行失败。
    • 适用场景:适合有明确的作业执行计划和资源需求的场景,如周期性的数据处理任务或者批量作业执行计划,能够提高作业执行的可靠性和稳定性。

以上是对常见的YARN调度器的简要分析,每种调度器都有其独特的特点和适用场景,可以根据具体的业务需求和资源管理策略选择合适的调度器来管理集群资源和调度作业。

相关文章
|
1月前
|
存储 分布式计算 资源调度
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
75 5
|
1月前
|
资源调度 数据可视化 大数据
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
36 4
|
1月前
|
XML 分布式计算 资源调度
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(一)
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(一)
151 5
|
1月前
|
XML 资源调度 网络协议
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(二)
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(二)
88 4
|
1月前
|
分布式计算 资源调度 Hadoop
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
77 4
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
Hadoop-19 Flume Agent批量采集数据到HDFS集群 监听Hive的日志 操作则把记录写入到HDFS 方便后续分析
45 2
|
1月前
|
SQL 分布式计算 大数据
大数据平台的毕业设计01:Hadoop与离线分析
大数据平台的毕业设计01:Hadoop与离线分析
104 0
|
2月前
|
分布式计算 资源调度 Hadoop
Hadoop YARN资源管理-公平调度器(Fackbook的Fair Scheduler)
详细介绍了Hadoop YARN资源管理中的公平调度器(Fair Scheduler),包括其概述、配置、队列结构、以及如何将作业提交到指定队列,展示了公平调度器如何通过分配文件(fair-scheduler.xml)来控制资源分配,并提供了配置示例和如何通过命令行提交作业到特定队列的方法。
149 0
Hadoop YARN资源管理-公平调度器(Fackbook的Fair Scheduler)
|
1月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
151 6
|
1月前
|
分布式计算 资源调度 Hadoop
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
65 2

相关实验场景

更多