静态模式和统一模式_2|学习笔记

简介: 快速学习 静态模式和统一模式_2

开发者学堂课程【大数据实时计算框架 Spark 快速入门:静态模式和统一模式_2】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/100/detail/1735


静态模式和统一模式_2


例子:

在集群上执行某个任务时,作业的处理被划分为几个阶段,每个阶段又被划分为任务。每个任务都是单独安排的。

可以将作为执行器工作的每个 JVMs 视为一个任务执行槽池,每个执行器将给您spark.executor.core / spark.task.cpus 为你的任务提供执行槽位,总计为spark.executor.instances executor。这是一个例子。

集群有 12 个节点运行 YARN 节点管理器,每个 64GB RAM 和 32 个 CPU 内核(16个物理内核超线程)。

这样,在每个节点上,你可以启动 2 个 executor,每个 executor 有 26GB 的RAM (留下一些 RAM 给系统进程,YARN NM 和 DataNode),每个 executor 有 12 个内核用于任务(留下一些内核给系统进程,YARN NM 和 DataNode)。

所以总的来说,你的集群将处理 12 台机器,每台机器 2 个执行器*每个执行器 12 个核/每个任务 1 个核 288 个任务槽。这意味着您的 Spark 集群将能够并行运行288 个任务,从而利用该集群上的几乎所有资源。

1.6 对内存的改进:

图片4.png

固定保留 300MB,默认总共 1024MB,1024MB-300MB 是 spark 使用的内存,User Memory 是 spark 的 25%,Spark Memory 是 75%,Storage Memory 和Execution Memory 各占一半。

 

各种配置:

spark,menory.useLegacyMode.

是否启用 Spark 1.5 及之前使用的遗留内存管理模式。遗留模式将堆空间划分为fixed-size 的区域,如果应用程序没有调优,可能将导致过度溢出。以下已弃用的内存片段配置不会被读取,除非启用 spark.shuffle, memoryFraction spark.storage.memoryFraction

spark.storage.unrollFraction

除此之外的等等配置,可在官网可见。

相关文章
|
4月前
|
前端开发 开发者 UED
|
5月前
|
缓存 Java 数据库连接
扩展类的附加特性
扩展类的附加特性
38 0
|
6月前
|
存储 Kubernetes API
在K8S中,静态、动态、自主式Pod有何区别?
在K8S中,静态、动态、自主式Pod有何区别?
|
Kubernetes 负载均衡 算法
你已经应用了哪种服务注册和发现的模式呢?
你已经应用了哪种服务注册和发现的模式呢?
107 1
|
监控 安全 网络架构
用于同步光网络 (SONET) 和同步数字体系 (SDH) 控制的通用多协议标签交换 (GMPLS) 扩展
本文档提供了特定于同步光网络 (SONET)/同步数字体系结构 (SDH) 的详细信息。根据 [RFC3471],SONET/SDH 特定参数在信令协议中携带在流量参数特定对象中。
529 0
|
缓存
读源码长知识 | 动态扩展类并绑定生命周期的新方式
在阅读viewModelScope源码时,发现了一种新的方式。 协程需隶属于某 CoroutineScope ,以实现structured-concurrency,而 CoroutineScope 应
193 0
|
XML Java 数据格式