Standalone+ZooKeeper 高可用部署_1

本文涉及的产品
MSE Nacos/ZooKeeper 企业版试用,1600元额度,限量50份
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
任务调度 XXL-JOB 版免费试用,400 元额度,开发版规格
简介: 快速学习 Standalone+ZooKeeper 高可用部署_1

开发者学堂课程【大数据实时计算框架 Spark 快速入门Standalone+ZooKeeper 高可用部署_1】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/100/detail/1655


Standalone+ZooKeeper 高可用部署_1


目录


一、内容介绍

二、搭建集群


一、内容介绍


如果想把数据生成 RD1,把 RD1 进行 persist 持久化处理,在生成 RD1 的时候,需要把 ATFL 里面的数据读过来进行计算,假设 RD1 生成 RD2count(),然后来从头执行,假设数据源是 HDFS 里面的一个 T 文件,再假设 RAM 里面内存为 512G,其内存不能加载 HDFS 文件,但是在 HDFS 里面有多个 block 块,HDFS 加载 block 块进来,生成 RD1 的一部分。

在生成 RD1之前,在里面运用 persist 持久化,这时候需要去看持久化的缓存策略。到了 RD2这部分的时候,就有一部分数据已经算出了结果,内存里面还保留着一些 RD1的数据,再读取下一批次的文件,读完内存里面去计算出 RD1,进行持久化。

如果此时内存还放得下,就再往内存里面存。如果装不下,新的这一批次的数据就会放在 RD2里面,以此类推。

当 RD2已经 count 出结果,如果有一个 RD2”来自 RD1, RD2”也使用count(),RD1缓存的数据生成 RD2。 RD2”一部分从内存来,一部分从本地磁盘来。

内存大于数据源的量最好,这样最快。如果不大于也没关系,相当于对它进行降级。


二、搭建集群


打开 node21、node22、node23、node24,并且都点击”开启此虚拟机”,在datanode 中放置 spark。Conf 下面有一个 spark-env。

image.png

这里准备一个脚本。

Class  指运行哪一类的幂函数,master 指的是运行模式是什么,local 指的是本地模式、单机模式,[]表示用几个线程来模拟这个机身,1则为单线程,2就是用本地两个线程来模拟机身,*则为本机所有的线程数量。

Jar 为执行哪一个jar包,100是 spark 需要的参数。Spark 参数越大,π 估算得就越准。

相关文章
|
4天前
|
云安全 人工智能 自然语言处理
|
8天前
|
人工智能 Java API
Java 正式进入 Agentic AI 时代:Spring AI Alibaba 1.1 发布背后的技术演进
Spring AI Alibaba 1.1 正式发布,提供极简方式构建企业级AI智能体。基于ReactAgent核心,支持多智能体协作、上下文工程与生产级管控,助力开发者快速打造可靠、可扩展的智能应用。
780 17
|
11天前
|
数据采集 人工智能 自然语言处理
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
797 59
Meta SAM3开源:让图像分割,听懂你的话
|
1天前
|
人工智能 安全 小程序
阿里云无影云电脑是什么?最新收费价格个人版、企业版和商业版无影云电脑收费价格
阿里云无影云电脑是运行在云端的虚拟电脑,分企业版和个人版。企业版适用于办公、设计等场景,4核8G配置低至199元/年;个人版适合游戏、娱乐,黄金款14元/月起。支持多端接入,灵活按需使用。
234 164
|
8天前
|
搜索推荐 编译器 Linux
一个可用于企业开发及通用跨平台的Makefile文件
一款适用于企业级开发的通用跨平台Makefile,支持C/C++混合编译、多目标输出(可执行文件、静态/动态库)、Release/Debug版本管理。配置简洁,仅需修改带`MF_CONFIGURE_`前缀的变量,支持脚本化配置与子Makefile管理,具备完善日志、错误提示和跨平台兼容性,附详细文档与示例,便于学习与集成。
332 116
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
335 3
|
6天前
|
弹性计算 搜索推荐 应用服务中间件
阿里云服务器租用价格:一年、1小时及一个月收费标准及优惠活动参考
阿里云服务器优惠汇总:轻量应用服务器200M带宽38元/年起,ECS云服务器2核2G 99元/年、2核4G 199元/年,4核16G 89元/月,8核32G 160元/月,香港轻量服务器25元/月起,支持按小时计费,新老用户同享,续费同价,限时秒杀低至1折。
404 166

热门文章

最新文章