Spark 源码初步剖析_1 | 学习笔记

简介: 快速学习 Spark 源码初步剖析_1

开发者学堂课程【大数据实时计算框架  Spark  快速入门Spark  源码初步剖析_1】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/100/detail/1668


Spark  源码初步剖析_1


内容介绍:

一、术语解释

二、Cluster Overview


一、术语解释

Application  基于 Spark  的用用户程序,包含了  drve  程序和集群上的   executor Driver Program  运行行  main  函数并且新建 SparkContext  的程序,Cluster Manager  在集群上获取资源的外部服务(例如  standalone, Mesos, Yarn)

WorkerNode  集群中任何可以运行行应用用代码的节点

Executor   是在二一个   worker node  上为某应用用启动的一个进程,该进程负责运行行任务,并且负责将数据存在内存或者磁盘上。每个应用用都有各自自独立立的 executors

Task  被送到某个   executor  上的工工作单元

Job  包含很多任务的并行行计算,可以看做和   Spark  的  action  对应

Stage-  个  b  会被拆分很多组任务,每组任务被称为

Stage  (就像  Mapreduce  分  map  任务和  reduce  任务一一样)

为什么窄依赖不能再切割:

因为窄依赖再被切割,Task  就不是这条  Pipeline   线。


二、Cluster Overview

Spark Content 初始化上下文

从应用程序角度划分从集群角度划分:

Application  (maln-sc-Driver ) Cluster

action

Jobs     worker node

wide

Stages   Executors   进

Pipeline

Tasks      Threads     线

相关文章
|
5月前
|
SQL 分布式计算 大数据
【大数据技术Spark】DStream编程操作讲解实战(图文解释 附源码)
【大数据技术Spark】DStream编程操作讲解实战(图文解释 附源码)
116 0
|
5月前
|
Java Shell 分布式数据库
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
139 0
|
5月前
|
分布式计算 Java 大数据
【大数据技术Hadoop+Spark】HDFS Shell常用命令及HDFS Java API详解及实战(超详细 附源码)
【大数据技术Hadoop+Spark】HDFS Shell常用命令及HDFS Java API详解及实战(超详细 附源码)
582 0
|
5月前
|
SQL 分布式计算 数据库
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
【大数据技术Spark】Spark SQL操作Dataframe、读写MySQL、Hive数据库实战(附源码)
199 0
|
5月前
|
分布式计算 大数据 Scala
【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战(超详细 附源码)
【大数据技术Hadoop+Spark】Spark RDD创建、操作及词频统计、倒排索引实战(超详细 附源码)
202 1
|
4月前
|
机器学习/深度学习 分布式计算 API
技术好文:Spark机器学习笔记一
技术好文:Spark机器学习笔记一
30 0
|
5月前
|
分布式计算 Java Hadoop
Spark3.3.0源码编译补充篇-抓狂的证书问题
Spark3.3.0源码编译补充篇-抓狂的证书问题
38 0
|
5月前
|
分布式计算 Java 测试技术
肝Spark源码的若干骚操作
肝Spark源码的若干骚操作
43 0
|
5月前
|
分布式计算 Java 程序员
Spark3.0源码编译打包
Spark3.0源码编译打包
31 0
|
5月前
|
分布式计算 监控 Java
Spark学习---day06、Spark内核(源码提交流程、任务执行)
Spark学习---day06、Spark内核(源码提交流程、任务执行)
下一篇
无影云桌面