一道Spark练习题

简介: 一道Spark练习题

Spark 支持的分布式部署方式中哪个是错误的?

涉及的知识点

(1)Local:运行在一台机器上,通常是练手或者测试环境。

(2)Standalone:构建一个基于 Master+Slaves 的资源调度集群,Spark 任务提交给 Master 运行。是 Spark 自身的一个调度系统。

(3)Yarn: Spark 客户端直接连接 Yarn, 不需要额外构建 Spark 集群。有 yarn-client 和

yarn-cluster 两种模式,主要区别在于:Driver 程序的运行节点。

(4)Mesos:国内大环境比较少用

选择D…


目录
相关文章
|
2月前
|
存储 分布式计算 并行计算
【赵渝强老师】Spark中的RDD
RDD(弹性分布式数据集)是Spark的核心数据模型,支持分布式并行计算。RDD由分区组成,每个分区由Spark Worker节点处理,具备自动容错、位置感知调度和缓存机制等特性。通过创建RDD,可以指定分区数量,并实现计算函数、依赖关系、分区器和优先位置列表等功能。视频讲解和示例代码进一步详细介绍了RDD的组成和特性。
|
8月前
|
分布式计算 Shell 开发工具
Spark编程实验二:RDD编程初级实践
Spark编程实验二:RDD编程初级实践
397 1
|
8月前
|
分布式计算 关系型数据库 MySQL
Spark编程实验四:Spark Streaming编程
Spark编程实验四:Spark Streaming编程
300 2
|
8月前
Scala100道练习题答案
Scala100道练习题答案
62 0
|
分布式计算 Shell Spark
spark学习记录
spark学习记录
44 0
|
分布式计算 大数据 Spark
|
存储 SQL 缓存
Spark面试题
spark的有几种部署模式,每种模式特点、Spark为什么比mapreduce快、简单说一下hadoop和spark的shuffle相同和差异、spark工作机制、spark的优化怎么做、数据本地性是在哪个环节确定的、RDD的弹性表现在哪几点、RDD有哪些缺陷、Spark的shuffle过程、 Spark的数据本地性有哪几种、Spark为什么要持久化,一般什么场景下要进行persist操作。
1250 0
Spark面试题
|
SQL 分布式计算 资源调度
spark 几道面试题
spark 几道面试题
|
存储 分布式计算 资源调度
【Spark】【复习】Spark入门考前概念相关题复习
【Spark】【复习】Spark入门考前概念相关题复习
378 0
|
存储 SQL 分布式计算
Spark面试题(四)
Spark中的HashShufle的相关方面的问题及解析。
228 0
Spark面试题(四)

热门文章

最新文章