五十、Spark组件部署（MINI版）-阿里云开发者社区

五十、Spark组件部署（MINI版）

2022-05-30 329

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

任务调度 XXL-JOB 版免费试用，400 元额度，开发版规格

服务治理 MSE Sentinel/OpenSergo，Agent数量不受限

注册配置 MSE Nacos/ZooKeeper，118元/月

简介： 五十、Spark组件部署（MINI版）

前景连接：

Hadoop HA部署（MINI版）https://blog.csdn.net/m0_54925305/article/details/121566611?spm=1001.2014.3001.5501

https://blog.csdn.net/m0_54925305/article/details/121566611?spm=1001.2014.3001.5501

环境准备：

编号	主机名	类型	用户	密码
1	master1-1	主节点	root	passwd
2	slave1-1	从节点	root	passwd
3	slave1-2	从节点	root	passwd

scala-2.11.8.tgz

spark-2.0.0-bin-hadoop2.7.tgz

注：提取码均为:0000

环境部署：

一、需前置 Hadoop 环境，并检查 Hadoop 环境是否可用，截图并保存结果

1、使用 jps 命令查看集群状态

二、解压 scala 安装包到“/usr/local/src”路径下，并更名为 scala，截图并保存结果

1、进入/h3cu/目录下找到压缩包

cd /h3cu/

2、解压scala

tar -zxvf scala-2.11.8.tgz -C /usr/local/src

3、重命名scala

mv scala-2.11.8 scala

三、设置 scala 环境变量，并使环境变量只对当前用户生效，截图并保存结果

1、添加scala环境变量

vi /root/.bashrc

2、使环境变量立即生效

source /root/.bashrc

四、进入 scala 并截图，截图并保存结果

1、输入命令 scala 进入scala界面

五、解压 Spark 安装包到“/usr/local/src”路径下，并更名为 spark，截图并保存结果

1、退出scala界面

使用ctrl + c 键退出scala界面

2、进入/h3cu/目录找到Spark

cd /h3cu/

3、解压Spark

tar -zxvf spark-2.0.0-bin-hadoop2.7.tgz -C /usr/local/src/

4、重命名Spark

mv spark-2.0.0-bin-hadoop2.7 spark

六、设置 Spark 环境变量，并使环境变量只对当前用户生效，截图并保存结果

1、添加Spark环境变量

vi /root/.bashrc

2、使环境变量立即生效

source /root/.bashrc

七、修改 Spark 参数配置，指定 Spark slave 节点，截图并保存结果

1、进入/usr/local/src/spark/conf目录

cd /usr/local/src/spark/conf

2、新建slaves文件并写入

vi slaves

注：该文件内容不可多无用空格或其他字符，严格遵守规范

3、新建spark-env.sh文件并写入

vi spark-env.sh

export JAVA_HOME=/usr/local/src/jdk1.8.0_221
export HADOOP_HOME=/usr/local/hadoop
export SCALA_HOME=/usr/local/src/scala
export SPARK_MASTER_IP=master1-1
export SPARK_MASTER_PORT=7077
export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)
export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop
export SPARK_YARN_USER_ENV="CLASSPATH=/usr/local/hadoop/etc/hadoop"
export YARN_CONF_DIR=/usr/local/hadoop/etc/hadoop
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=master1-1:2181,slave1-1:2181,slave1-2:2181 -Dspark.deploy.zookeeper.dir=/spark"

注：其中，三个参数的意义分别为： SPARK_DIST_CLASSPATH 是完成 spark 和 hadoop 的挂接，HADOOP_CONF_DIR 是说明了 hadoop 相关配置信息的目录， SPARK_MASTER_IP 是指明该集群中主节点的 IP 地址或者名称

4、集群分发

scp -r /usr/local/src/spark slave1-1:/usr/local/src/
scp -r /usr/local/src/spark slave1-2:/usr/local/src/
scp -r /root/.bashrc slave1-1:/root/.bashrc
scp -r /root/.bashrc slave1-2:/root/.bashrc

5、确保所有机器环境变量已经生效

source /root/.bashrc

注：三台机器均需执行

八、启动 Spark，并使用命令查看 webUI 结果，截图并保存结果

1、进入spark安装目录下启动spark

sbin/start-all.sh

注：确保zookeeper已经正常启动

2、浏览器输入master1-1:8080查看web UI

3、slave端启动master

sbin/start-master.sh

注：通过观察可知，主节点的 Master 状态为活动状态，从节点的Master状态为备用状态，即为集群成功运行

Spark组件部署（MINI版）完成

五十、Spark组件部署（MINI版）

前景连接：

环境准备：

环境部署：

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

五十、Spark组件部署（MINI版）

前景连接：

环境准备：

环境部署：

热门文章

最新文章

相关课程

相关电子书