备案控制台

开发者社区大数据文章正文

Spark集群独立模式HA

2017-11-23 989

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

一、Spark简介：

Spark是一种与Hadoop相似的开源集群计算环境

Spark基于MR算法实现的分布式计算，拥有Hadoop MR的优点，不同的是结果保存在内存中

Spark是一个针对超大数据集合的低延迟的集群分布式计算系统，比MapReduce快40倍左右

Spark是在 Scala 语言中实现的，它将 Scala 用作其应用程序框架

Spark兼容Hadoop的API，能够读写Hadoop的HDFS HBASE 顺序文件等

传统的hadoop

Spark

环境概述：

192.168.1.2 master

192.168.1.3 worker

192.168.1.4 worker

二、Scala环境设置

 
        [root@master ~]
        # tar zxvf scala-2.10.4.tgz -C /home/hadoop/ 
       
        [root@master ~]
        # cd /home/hadoop/ 
       
        [root@master hadoop]
        # ln -s scala-2.10.4 scala 
       
        [root@master ~]
        # chown -R hadoop.hadoop /home/hadoop/ 
       
        # Scala
       
        export 
        SCALA_HOME=
        /home/hadoop/scala 
       
        export 
        PATH=$PATH:$HADOOP_DEV_HOME
        /sbin
        :$HADOOP_DEV_HOME
        /bin
        :$SCALA_HOME
        /bin 
       
        [root@master hadoop]
        # source /home/hadoop/.bashrc  
       
        [root@master hadoop]
        # su - hadoop 
       
        [hadoop@master ~]$ scala
       
        Welcome to Scala version 2.10.4 (Java HotSpot(TM) 64-Bit Server VM, Java 1.7.0_25 ).

 
        本文转自ljl_19880709 51CTO博客，原文链接：http://blog.51cto.com/luojianlong/1622837
   ，如需转载请自行联系原作者

文章标签：

分布式计算

算法

Hadoop

Spark

Hbase

Scala

API

分布式数据库

关键词：

apache spark集群

apache spark模式

技术小胖子

目录

相关文章

阿甘兄

|

8月前

|

分布式计算 Linux Spark

179 Spark集群安装

179 Spark集群安装

阿甘兄

41 0 0

vohelon

|

20天前

|

存储分布式计算监控

Spark Standalone模式是一种集群部署方式

【6月更文挑战第17天】Spark Standalone模式是一种集群部署方式

vohelon

24 7 7

小竹笋

|

16天前

|

分布式计算 Shell Linux

Spark-集群安装、部署、启动、测试（1.6.3）稳定版

Spark-集群安装、部署、启动、测试（1.6.3）稳定版

小竹笋

21 0 0

敏叔V587

|

2月前

|

分布式计算资源调度调度

利用SparkLauncher实现Spark Cluster模式下的远端交互

利用SparkLauncher实现Spark Cluster模式下的远端交互

敏叔V587

24 0 0

敏叔V587

|

2月前

|

机器学习/深度学习分布式计算并行计算

Spark 3.0 中的屏障执行模式_Spark的MPI时代来了

Spark 3.0 中的屏障执行模式_Spark的MPI时代来了

敏叔V587

19 0 0

Maynor

|

2月前

|

分布式计算监控 Java

Note_Spark_Day02：Standalone集群模式和使用IDEA开发应用程序

Note_Spark_Day02：Standalone集群模式和使用IDEA开发应用程序

Maynor

61 0 0

程序员朱永胜

|

10月前

|

分布式计算大数据 Spark

基于Docker搭建大数据集群（四）Spark部署

基于Docker搭建大数据集群（四）Spark部署

程序员朱永胜

196 1 1

孙玉洁-47170

|

2月前

|

分布式计算资源调度监控

Spark学习--1、Spark入门（Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式）（一）

Spark学习--1、Spark入门（Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式）（一）

孙玉洁-47170

154 1 1

游客4llb6htoixmxw

|

2月前

|

分布式计算数据处理 Scala

Spark 集群和 Scala 编程语言的关系

Spark 集群和 Scala 编程语言的关系

游客4llb6htoixmxw

54 0 0

赵广陆

|

10月前

|

分布式计算资源调度监控

Spark Yarn模式部署集群

Spark Yarn模式部署集群

赵广陆

59 1 1

热门文章

最新文章

白话 uni-app，细说 uni-app 和传统 H5 的区别

图解大数据 | 使用Spark分析新冠肺炎疫情数据@综合案例

Spring Boot 集成 MyBatis和 SQL Server实践

阿里双11 同款，流量防卫兵 Sentinel go 源码解读

【资料下载】Python 第十讲——xpath元素定位获取及爬虫中使用实例

spark-streaming-kafka-0-8 官网讲解

Spark 分析网站排名热度

2 分钟读懂大数据框架 Hadoop 和 Spark 的异同

NEC新技术带来比Apach Spark快50倍的机器学习能力

hadoop/spark节点动态调整

spark用于分析数据并将数据保存到数据库中是

数据分享|Python、Spark SQL、MapReduce决策树、回归对车祸发生率影响因素可视化分析

如何解决Spark在深度学习中的资源消耗问题？

Spark在深度学习中的优缺点是什么？

使用Spark进行机器学习

Spark是一个基于内存的通用数据处理引擎，可以进行大规模数据处理和分析

【Spark】Spark基础教程知识点

DataWorks产品使用合集之在DataWorks中，通过spark访问外网的步骤如何解决

MaxCompute操作报错合集之大数据计算的MaxCompute Spark引擎无法读取到表，是什么原因

MaxCompute操作报错合集之spark3.1.1通过resource目录下的conf文件配置，报错如何解决

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第四阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第七阶段

大数据实时计算框架Spark快速入门

相关电子书

更多

Hybrid Cloud and Apache Spark

Scalable Deep Learning on Spark

Comparison of Spark SQL with Hive

下一篇

部署LAMP环境（Alibaba Cloud Linux 3）