备案控制台

开发者社区大数据文章正文

Spark的部署模式

2022-05-23 148

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Spark的部署模式

Spark支持3种集群管理器（Cluster Manager），分别为：

Standalone：独立模式，Spark原生的简单集群管理器，自带完整的服务，可单独部署到一个集群中，无需依赖任何其他资源管理系统，使用Standalone可以很方便地搭建一个集群； --master spark://jinghang01:7077
Apache Mesos：一个强大的分布式资源管理框架，它允许多种不同的框架部署在其上； --master mesos://jinghang01:7077
Hadoop YARN：统一的资源管理机制，在上面可以运行多套计算框架，如map reduce、storm等，根据driver在集群中的位置不同，分为yarn client和yarn cluster。 --master yarn-client --master yarn-cluster

实际上，除了上述这些通用的集群管理器外，Spark内部也提供了一些方便用户测试和学习的简单集群部署模式。由于在实际工厂环境下使用的绝大多数的集群管理器是Hadoop YARN，因此我们关注的重点是Hadoop YARN模式下的Spark集群部署。
Spark的运行模式取决于传递给SparkContext的MASTER环境变量的值，个别模式还需要辅助的程序接口来配合使用，目前支持的Master字符串及URL包括：
Spark运行模式配置.png
用户在提交任务给Spark处理时，以下两个参数共同决定了Spark的运行方式。

–master MASTER_URL ：决定了Spark任务提交给哪种集群处理。
–deploy-mode DEPLOY_MODE：决定了Driver的运行方式，可选值为Client或者Cluster。

--deploy-mode client/cluster

文章标签：

流计算

分布式计算

资源调度

Spark

Apache

Hadoop

关键词：

apache spark部署

apache spark模式

apache spark部署模式

永恒云

目录

相关文章

vohelon

|

13天前

|

存储分布式计算监控

Spark Standalone模式是一种集群部署方式

【6月更文挑战第17天】Spark Standalone模式是一种集群部署方式

vohelon

23 7 7

小竹笋

|

9天前

|

分布式计算 Shell Linux

Spark-集群安装、部署、启动、测试（1.6.3）稳定版

Spark-集群安装、部署、启动、测试（1.6.3）稳定版

小竹笋

15 0 0

敏叔V587

|

2月前

|

分布式计算资源调度调度

利用SparkLauncher实现Spark Cluster模式下的远端交互

利用SparkLauncher实现Spark Cluster模式下的远端交互

敏叔V587

24 0 0

敏叔V587

|

2月前

|

机器学习/深度学习分布式计算并行计算

Spark 3.0 中的屏障执行模式_Spark的MPI时代来了

Spark 3.0 中的屏障执行模式_Spark的MPI时代来了

敏叔V587

17 0 0

Maynor

|

2月前

|

分布式计算监控 Java

Note_Spark_Day02：Standalone集群模式和使用IDEA开发应用程序

Note_Spark_Day02：Standalone集群模式和使用IDEA开发应用程序

Maynor

60 0 0

程序员朱永胜

|

10月前

|

分布式计算大数据 Spark

基于Docker搭建大数据集群（四）Spark部署

基于Docker搭建大数据集群（四）Spark部署

程序员朱永胜

194 1 1

孙玉洁-47170

|

2月前

|

分布式计算资源调度监控

Spark学习--1、Spark入门（Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式）（一）

Spark学习--1、Spark入门（Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式）（一）

孙玉洁-47170

150 1 1

赵广陆

|

10月前

|

分布式计算资源调度监控

Spark Yarn模式部署集群

Spark Yarn模式部署集群

赵广陆

59 1 1

明哥的IT随笔

|

9月前

|

SQL 分布式计算资源调度

分享一个 hive on spark 模式下使用 HikariCP 数据库连接池造成的资源泄露问题

分享一个 hive on spark 模式下使用 HikariCP 数据库连接池造成的资源泄露问题

明哥的IT随笔

113 0 0

明哥的IT随笔

|

9月前

|

分布式计算资源调度 Kubernetes

大数据问题排查系列 - SPARK STANDALONE HA 模式的一个缺陷点与应对方案

大数据问题排查系列 - SPARK STANDALONE HA 模式的一个缺陷点与应对方案

明哥的IT随笔

108 0 0

热门文章

最新文章

图解大数据 | 使用Spark分析新冠肺炎疫情数据@综合案例

spark-streaming-kafka-0-8 官网讲解

Spark中RDD、DataFrame、DataSet的生成与互相转换（非常重要）

Spark 分析网站排名热度

2 分钟读懂大数据框架 Hadoop 和 Spark 的异同

NEC新技术带来比Apach Spark快50倍的机器学习能力

hadoop/spark节点动态调整

流式大数据处理的三种框架：Storm，Spark和Samza

Spark集群独立模式HA

Spark（十一） -- Mllib API编程线性回归、KMeans、协同过滤演示

bigdata-36-Spark转换算子与动作算子

Paimon 与 Spark 的集成（二）：查询优化

阿里云 EMR Serverless Spark 版免费邀测中

Spark学习---SparkSQL（概述、编程、数据的加载和保存、自定义UDFA、项目实战）

Spark学习---day07、Spark内核（Shuffle、任务执行）

Spark读取变更Hudi数据集Schema实现分析

实战|使用Spark Streaming写入Hudi

adb spark的lakehouse api访问内表数据，还支持算子下推吗

Spark学习---day06、Spark内核（源码提交流程、任务执行）

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）