SparkPi代码剖析4 | 学习笔记

简介: 快速学习SparkPi代码剖析4

开发者学堂课程【大数据实时计算框架Spark快速入门SparkPi代码剖析4】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/100/detail/1679


SparkPi代码剖析4


内容介绍:

一、Speculation  机制

二、Taskscheduler  与  DAGscheduler

三、Job  调度流程

四、SparkPi 代码



一、Speculation 机制

spark起同样的一个task,二者同时运行。


二、Taskscheduler 与 DAGscheduler

Taskscheduler  不知道每一个 stage 分别来自哪一个 job,

只把stage ,TaskSet 运行完,对于 DAGscheduler  才整体知道 job 的调度。


三、Job调度流程

image.png



四、 SparkPi 代码

object SparkPi {

def main (args: Array [String]) {

val conf = new SparkConf().setAppName("Spark Pi")

val spark = new Sparkcontext (conf)

val slices = if (args. length > 0) args (0). toInt else 2

val n = math.min(100000L* slices,Int.MaxValue).toInt // avoid overflow  

val count = spark. parallelize (1 until n, slices). map {i = >

val x = random*2-1

val y = random*2-1

if (x* x+ y y < 1) 1 else 0

}.reduce(_+_)

println ("Pi is roughly"+ 4.0* count/n)

spark. stop ()

}

}

相关文章
|
5月前
|
前端开发
【面试题】如何使用ES6 ... 让代码优雅一点?
【面试题】如何使用ES6 ... 让代码优雅一点?
|
5天前
|
数据采集 开发框架 前端开发
代码实战
本文详细介绍了使用BeautifulSoup4解析HTML文档的方法,包括标签选择器、属性选择器等基本操作。通过实际案例演示了如何结合Requests库从网页中提取标题、链接和发布时间等信息。文章还讨论了爬虫的道德准则、安全性及优化建议,如使用Session保持会话、多线程请求等。最后,针对反爬虫策略提出了一系列应对措施,帮助读者提高爬虫效率和稳定性。本文适合希望深入了解BeautifulSoup4及其在爬虫项目中应用的开发者阅读。
13 3
|
5月前
|
JavaScript Java 测试技术
基于Java的汇编课程网站的设计与实现(源码+lw+部署文档+讲解等)
基于Java的汇编课程网站的设计与实现(源码+lw+部署文档+讲解等)
28 0
|
5月前
|
SQL 分布式计算 Java
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
291 1
|
前端开发
前端学习案例-ref的进阶用法1
前端学习案例-ref的进阶用法1
81 0
前端学习案例-ref的进阶用法1
|
前端开发
前端知识学习案例9vs code-复制操作
前端知识学习案例9vs code-复制操作
58 0
前端知识学习案例9vs code-复制操作
|
前端开发
前端知识学习案例21vs code-跳转或者查看函数定义
前端知识学习案例21vs code-跳转或者查看函数定义
79 0
前端知识学习案例21vs code-跳转或者查看函数定义
|
分布式计算 Hadoop 大数据
Spark 原理_总结介绍_案例编写 | 学习笔记
快速学习 Spark 原理_总结介绍_案例编写
108 0
Spark 原理_总结介绍_案例编写 | 学习笔记
|
缓存 文字识别 运维
开发一个小程序 Demo| 学习笔记
快速学习开发一个小程序 Demo。
170 0
开发一个小程序 Demo| 学习笔记
|
缓存 小程序 IDE
开发一个小程序 Demo|学习笔记
快速学习 开发一个小程序 Demo
192 0
开发一个小程序 Demo|学习笔记