文档备案控制台

开发者社区问答正文

spark的有几种部署模式，每种模式特点？

spark的有几种部署模式，每种模式特点？

展开

收起

茶什i 2019-10-25 16:07:54 3696 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

苍霞学子

下一站是幸福

local(本地模式)：常用于本地开发测试，本地还分为local单线程和local-cluster多线程; standalone(集群模式)：典型的Mater/slave模式，不过也能看出Master是有单点故障的；Spark支持ZooKeeper来实现 HA on yarn(集群模式)：运行在 yarn 资源管理器框架之上，由 yarn 负责资源管理，Spark 负责任务调度和计算 on mesos(集群模式)：运行在 mesos 资源管理器框架之上，由 mesos 负责资源管理，Spark 负责任务调度和计算 on cloud(集群模式)：比如 AWS 的 EC2，使用这个模式能很方便的访问 Amazon的 S3;Spark 支持多种分布式存储系统：HDFS 和 S3

2020-08-21 13:34:51

赞同展开评论
珍宝珠

1）本地模式 Spark不一定非要跑在hadoop集群，可以在本地，起多个线程的方式来指定。将Spark应用以多线程的方式直接运行在本地，一般都是为了方便调试，本地模式分三类 · local：只启动一个executor · local[k]:启动k个executor · local ：启动跟cpu数目相同的 executor

2)standalone模式分布式部署集群，自带完整的服务，资源管理和任务监控是Spark自己监控，这个模式也是其他模式的基础，

3)Spark on yarn模式分布式部署集群，资源和任务监控交给yarn管理，但是目前仅支持粗粒度资源分配方式，包含cluster和client运行模式，cluster适合生产，driver运行在集群子节点，具有容错功能，client适合调试，dirver运行在客户端

4）Spark On Mesos模式。官方推荐这种模式（当然，原因之一是血缘关系）。正是由于Spark开发之初就考虑到支持Mesos，因此，目前而言，Spark运行在Mesos上会比运行在YARN上更加灵活，更加自然。用户可选择两种调度模式之一运行自己的应用程序：
1) 粗粒度模式（Coarse-grained Mode）：每个应用程序的运行环境由一个Dirver和若干个Executor组成，其中，每个Executor占用若干资源，内部可运行多个Task（对应多少个“slot”）。应用程序的各个任务正式运行之前，需要将运行环境中的资源全部申请好，且运行过程中要一直占用这些资源，即使不用，最后程序运行结束后，回收这些资源。
2) 细粒度模式（Fine-grained Mode）：鉴于粗粒度模式会造成大量资源浪费，Spark On Mesos还提供了另外一种调度模式：细粒度模式，这种模式类似于现在的云计算，思想是按需分配。

2019-10-25 16:12:44

赞同 1 展开评论

问答分类：

分布式计算 Spark

问答标签：

apache spark模式 apache spark部署 apache spark特点 apache spark部署模式 apache spark部署模式特点

问答地址：

开发者社区 > 大数据 > 问答

相关问答

大数据计算MaxCompute Spark可以支持yarn client模式吗？

207

1

0

大数据计算MaxCompute Spark Local 模式启动报错，还需要开其他的配置么？

243

1

0

大数据计算MaxCompute在idea下的Local模式下运行Spark，报错怎么排查这个问题啊？

381

5

0

在client模式下，如果spark job的jar包过大，可能会导致什么问题？如何解决？

272

1

0

Spark的RDD和DataFrame编程模式如何帮助提升核算效率？

192

1

0

在ECS部署的airflow如何将spark作业提交到E-MapReduce集群上

209

1

0

请问bin/spark-sql --master yarn不能进行集群模式运行吗？

662

4

0

在edas里部署的镜像里面调用maxcompute的spark的sparksubmit的时候怎么解决

202

1

0

老哥我们想在客户的内网部署我们的产品后，在maxcompute上提交spark离线任务，但是这个？

587

1

0

请问一下k8s上面部署的spark怎么进行压力测试呢，现有的hibench可以进行测试吗

896

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

动态变量话术引擎对直播有什么作用？

新手如何进行OSS 图片处理 CDN 加速？

什么年代了，qoder cn还不支持多agent协同一起完成任务

qoder 资源包买完找不到记录也不知道再用，究竟是谁设计的，没见过这样的设计，

需要支持自定义Kimi k3 API

相关文章

Lake Search：ES x Paimon 让湖上多模态数据可搜可用

EMR Serverless Spark PB级文本语义去重4倍加速的技术方案解读

阿里云数据总线DataHub深度对接实战指南：从入门到生产级管道构建

EMR + Flink 实战：从离线T+1到实时数仓的完整迁移路径

Hologres + Flink 实时OLAP分析实战：从T+1报表到秒级洞察的数据平台

相关解决方案

更多

快速部署DeepSeek-OCR

一键部署幻兽帕鲁游戏服务器

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

极速构建持续集成与部署流程

还有其他疑问?