Spark中的资源调度

简介: 本文对Spark的资源调度的进行了介绍,涉及到4个维度的调度,包括SparkApplication/pool/TaskSetManager/Task。

Spark中涉及的资源调度可以分为4层:

  • YARN对不同SparkApplication(SparkContext)的调度
  • 同一个SparkAppliction内不同资源池(pool)之间的调度
  • 同一个SparkAppliction内同一个资源池(pool)内不同TaskSetManager的调度
  • 同一个SparkAppliction内同一个资源池(pool)内同一个TaskSetManager内的Task调度

11

前置

为啥需要资源调度

当用户提交作业,Spark内部的执行流程如下图:

Spark

Spark上层的SQL/Streaming等最终都会生成RDD到底层SparkCore执行。如上图所示当RDD执行一个action类型的算子(如collect)会触发一个Job的提交到DAGSchedulerDAGScheduler会将Job拆成Stage(根据shuffle来拆分Stage)形成一个DAG,拆分的Stage之间有依赖关系,最后执行的是ResultStage,ResuStage之前会依赖ShuffleMapStage等,每个Stage的执行都需要先将它的父Stage执行完成。

当提交一个Stage执行时,Spark会给Stage生成一个对应的TaskSetManager,TaskSetManager用来管理该Stage中所有的Task。

当有多个用户同时提交作业到同一个SparkApplication时(如通过beeline客户端提交SQL到SparkThriftServer,SparkThriftServer就是一个常驻的SparkApplication),SparkApplication里面最终会有很多的TaskSetManager产生,那如何对这些TaskSetManager进行调度呢,比如当有资源空闲的时候选择哪个TaskSetManager先执行呢?当选择了某个TaskSetManager后,如何选择该TaskSetManager里面的某个Task优先执行呢?这里面就涉及了资源调度的问题。

Spark调度器

参考: Spark调度文档
Spark调度器是指在同一个SparkApplication内Spark如何对TaskSetManager(图中简写TSM)进行调度,以及同一个TaskSetManager内的Task如何调度。

调度类型

Spark内部支持两种类型的资源调度

场景 调度类型 备注
pool之间 FIFO/FAIR 可以通过spark.scheduler.mode来配置
pool内 FIFO/FAIR 若spark.scheduler.mode=FIFO,则pool内只能是FIFO,若spark.scheduler.mode=FAIR,pool内可以通过fairscheduler.xml来配置,可以为FIFO或者FAIR
  • FIFO
    先入先出,后面的TaskSetManager要等比自己先提交的TaskSetManager执行完了才能执行,如果先提交的TaskSetManager要很长很长时间才能执行完,也只能等待。如第一个人提交了一个大SQL,第二个人提交了一个很小的SQL(可能几秒就运行完了),也是需要等待大SQL有资源空出了才能执行。
  • FAIR

公平调度,会根据fairscheduler.xml里面的相关配置来进行调度,如weight/minShare等配置信息进行调度。即使前面有个大SQL运行,小SQL也是有机会获取到资源运行(根据实际的配置信息),不需要等待。

配置使用流程

  1. 启动SparkApplication可以执行pool之间的调度策略,通过spark.scheduler.mode来指定(默认FIFO)
  2. 如果是使用FAIR时,用户启动前还需要提供资源池的配置信息(fairscheduler.xml),
    参考如下
<allocations>
  <pool name="production">
    <schedulingMode>FAIR</schedulingMode>
    <weight>1</weight>
    <minShare>2</minShare>
  </pool>
  <pool name="test">
    <schedulingMode>FIFO</schedulingMode>
    <weight>2</weight>
    <minShare>3</minShare>
  </pool>
</allocations>
  1. 如果是FAIR,用户提交作业时可指定pool名称,可通过设置spark.scheduler.pool来指定,默认是default
  2. 如果是FAIR,提交完后Spark会通过FAIR进行pool之间的调度,以及pool内部通过fairscheduler.xml的配置策略调度(如上面xml中test pool内部使用FIFO来调度,而production pool内部使用FAIR来调度)

UI显示

FIFO
_2018_12_21_6_33_26

FAIR
_2018_12_21_6_31_00

4层调度

SparkApplication调度

用户提交SparkApplication到YARN中运行,是通过YARN的队列(Queue)进行调度。提交SparkApplication时可以通过参数spark.yarn.queue来指定该SparkApplication提交到YARN的哪个队列(该队列的具体资源配置可参考YARN官方文档( FAIR, Capacity)

pool之间的调度

同一个SparkApplication内部可参考上面前置->配置使用流程小节。

通过spark.scheduler.mode来设置启动SparkApplicaion,如果是FAIR,需要配置好fairscheduler.xml。

pool内的调度

同一个pool内部可参考上面前置->配置使用流程小节。

spark.scheduler.mode=FIFO,pool内部只能默认使用FIFO调度,用户也无需配置相关xml;
spark.scheduler.mode=FAIR,需要用到前面的fairscheduler.xml,通过spark.scheduler.pool来设置提交到哪个pool

TaskSetManager内的Task调度

TaskSetManager是pool内调度的单元,当pool内部根据调度算法获取到了某个TaskSetManager,然后还需要从这个TaskSetManager获取到一些Task来实际运行,这个地方就是TaskSetManager内部的Task调度。

Task调度主要是考虑locality,即对于某个被调度的executor,根据
ROCESS_LOCAL -> NODE_LOCAL -> NO_PREF -> RACK_LOCAL ->ANY的顺序从TaskSetManager中选择Task去这个executor上面执行。

测试

测试SQL

SQL 备注
大SQL 整个SQL执行完耗费时间长
小SQL 整个SQL执行完耗费时间短

测试环境

使用SparkThriftServer进行测试,fairscheduler.xml使用上面的配置。

测试场景

场景 pool间调度 pool内调度
场景1 FIFO
场景2 FAIR 大SQL和小SQL分别提交到各自pool
场景3 FAIR 大SQL和小SQL提交到同一个pool(FIFO/FAIR)

备注: 都是先提交大SQL,然后再提交小SQL

测试结果

  • 场景1
    小SQL等待大SQL有资源空出(如最后大SQL只剩余几个Task在跑了)才能执行,即需要等待
  • 场景2
    小SQL不需要等待大SQL空出资源,当大SQL在执行的过程中,小SQL有机会能根据FAIR算法获取到资源执行。
  • 场景3
    当pool内部调度是FIFO时,小SQL需要等待大SQL资源空出

当pool内部调度是FAIR时,当大SQL在执行的过程中,小SQL有机会能根据FAIR算法获取到资源执行。

_

相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
目录
相关文章
|
分布式计算 资源调度 Spark
Spark Master资源调度--worker向master注册
Spark Master资源调度–Worker向Master注册 更多资源 github: https://github.
1117 0
|
分布式计算 资源调度 Spark
Spark Master资源调度--SparkContext向所有master注册
Spark Master资源调度–SparkContext向所有master注册 更多资源 github: https://github.
746 0
|
资源调度 调度 分布式计算
|
1月前
|
机器学习/深度学习 SQL 分布式计算
Apache Spark 的基本概念和在大数据分析中的应用
介绍 Apache Spark 的基本概念和在大数据分析中的应用
209 0
|
1月前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。
|
1月前
|
机器学习/深度学习 SQL 分布式计算
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
|
18小时前
|
分布式计算 Hadoop 大数据
大数据技术:Hadoop与Spark的对比
【6月更文挑战第15天】**Hadoop与Spark对比摘要** Hadoop是分布式系统基础架构,擅长处理大规模批处理任务,依赖HDFS和MapReduce,具有高可靠性和生态多样性。Spark是快速数据处理引擎,侧重内存计算,提供多语言接口,支持机器学习和流处理,处理速度远超Hadoop,适合实时分析和交互式查询。两者在资源占用和生态系统上有差异,适用于不同应用场景。选择时需依据具体需求。
|
3天前
|
分布式计算 大数据 数据处理
Apache Spark在大数据处理中的应用
Apache Spark是大数据处理的热门工具,由AMPLab开发并捐赠给Apache软件基金会。它以内存计算和优化的执行引擎著称,提供比Hadoop更快的处理速度,支持批处理、交互式查询、流处理和机器学习。Spark架构包括Driver、Master、Worker Node和Executor,核心组件有RDD、DataFrame、Dataset、Spark SQL、Spark Streaming、MLlib和GraphX。文章通过代码示例展示了Spark在批处理、交互式查询和实时数据处理中的应用,并讨论了其优势(高性能、易用性、通用性和集成性)和挑战。【6月更文挑战第11天】
25 6
|
3天前
|
存储 分布式计算 并行计算
【大数据】计算引擎:Spark核心概念
【大数据】计算引擎:Spark核心概念
23 0
|
4天前
|
分布式计算 数据可视化 大数据
基于spark的医疗大数据可视化大屏项目
基于spark的医疗大数据可视化大屏项目