备案控制台

开发者社区大数据文章正文

Apache Spark的部署环境的小记

2017-11-14 1458

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Spark的单机版便于测试，同时通过SSH用Spark的内置部署脚本搭建Spark集群，使用Mesos、Yarn或者Chef来部署Spark。对于Spark在云环境中的部署，比如在EC2(基本环境和ECMR)上的部署。

　　请移步，见我的下面博客

Spark运行模式概述

注意：EMR(Elastic MapReduce)，即弹性MapReduce。亚马逊弹性MapReduce(Amazon EMR)

1、从Spark源码搭建Spakr环境

2、在云环境搭建搭建Spakr环境

3、通过SSH搭建Spakr环境

　　如果集群未安装任何集群管理软件，你能用一些方便Spark部署的脚本通过SSH部署Spark，这种方式在Spark文档中叫“standlone”模式。

4、在YARN上搭建Spakr环境

5、在Mesos上搭建Spakr环境

　　进一步学习，请移步Spark集群搭建（1、3和5节点）（含CentOS系统和Ubuntu系统） (博主推荐）

本文转自大数据躺过的坑博客园博客，原文链接：http://www.cnblogs.com/zlslch/p/5717422.html，如需转载请自行联系原作者

文章标签：

分布式计算

Spark

测试技术

Apache

大数据

关键词：

apache apache spark

Apache spark

apache spark Apache

apache spark环境

apache spark部署

技术小哥哥

目录

相关文章

武子康

|

分布式计算资源调度 Hadoop

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

大数据-80 Spark 简要概述系统架构部署模式与Hadoop MapReduce对比

武子康

309 2 2

武子康

|

SQL 机器学习/深度学习分布式计算

大数据-81 Spark 安装配置环境集群环境配置超详细三台云服务器

大数据-81 Spark 安装配置环境集群环境配置超详细三台云服务器

武子康

788 1 1

dufadayang

|

数据处理 Apache 数据库

将 Python UDF 部署到 Apache IoTDB 的详细步骤与注意事项

【10月更文挑战第21天】将 Python UDF 部署到 Apache IoTDB 中需要一系列的步骤和注意事项。通过仔细的准备、正确的部署和测试，你可以成功地将自定义的 Python UDF 应用到 Apache IoTDB 中，为数据处理和分析提供更灵活和强大的支持。在实际操作过程中，要根据具体情况进行调整和优化，以确保实现最佳的效果。还可以结合具体的代码示例和实际部署经验，进一步深入了解和掌握这一过程。

dufadayang

213 2 2

龙大吉

|

分布式计算大数据 Apache

利用.NET进行大数据处理：Apache Spark与.NET for Apache Spark

【10月更文挑战第15天】随着大数据成为企业决策和技术创新的关键驱动力，Apache Spark作为高效的大数据处理引擎，广受青睐。然而，.NET开发者面临使用Spark的门槛。本文介绍.NET for Apache Spark，展示如何通过C#和F#等.NET语言，结合Spark的强大功能进行大数据处理，简化开发流程并提升效率。示例代码演示了读取CSV文件及统计分析的基本操作，突显了.NET for Apache Spark的易用性和强大功能。

龙大吉

380 1 1

职说测试

|

关系型数据库 MySQL 应用服务中间件

win7系统搭建PHP+Mysql+Apache环境+部署ecshop项目

这篇文章介绍了如何在Windows 7系统上搭建PHP、MySQL和Apache环境，并部署ECShop项目，包括安装配置步骤、解决常见问题以及使用XAMPP集成环境的替代方案。

职说测试

207 1 1

win7系统搭建PHP+Mysql+Apache环境+部署ecshop项目

刘大猫.

|

消息中间件分布式计算 Java

Linux环境下 java程序提交spark任务到Yarn报错

Linux环境下 java程序提交spark任务到Yarn报错

刘大猫.

215 5 5

sunr0ng

|

Linux Apache 数据安全/隐私保护

kali向Apache上部署网页

kali向Apache上部署网页

sunr0ng

361 5 5

jianz123

|

分布式计算 Hadoop 大数据

大数据处理框架在零售业的应用：Apache Hadoop与Apache Spark

【8月更文挑战第20天】Apache Hadoop和Apache Spark为处理海量零售户数据提供了强大的支持

jianz123

337 0 0

扬流

|

分布式计算 Serverless 数据处理

EMR Serverless Spark 实践教程 | 通过 Apache Airflow 使用 Livy Operator 提交任务

Apache Airflow 是一个强大的工作流程自动化和调度工具，它允许开发者编排、计划和监控数据管道的执行。EMR Serverless Spark 为处理大规模数据处理任务提供了一个无服务器计算环境。本文为您介绍如何通过 Apache Airflow 的 Livy Operator 实现自动化地向 EMR Serverless Spark 提交任务，以实现任务调度和执行的自动化，帮助您更有效地管理数据处理任务。

扬流

512 0 0

热门文章

最新文章

阿里巴巴瑾谦/沐远：云HBaseSQL及分析——Phoenix&Spark

【译】使用Spark SQL 运行大规模基因组工作流

云栖社区2019年1月技术活动：PG， Java，Spark等30+场预告【持续更新】

【Spark Summit East 2017】使用Spark进行时间序列分析

钉钉群直播【Spark Relational Cache 原理和实践】

数据处理平台架构中的SMACK组合：Spark、Mesos、Akka、Cassandra以及Kafka

Spark SQL概述及特点详解

【大数据技术Hadoop+Spark】HDFS概念、架构、原理、优缺点讲解（超详细必看）

7月9日Spark社区直播【通过LLVM加速SparkSQL时间窗口计算】

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

云计算新宠：探索Apache Doris的云原生策略

HBase Shell-org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet 已解决

org.apache.hadoop.security.AccessControlException Permission denied: user=anonymous, access=WRITE...

org.apache.ibatis.binding.BindingException: Invalid bound statement (not found): com.example.forum.d

AutoMQ 生态集成 Apache Doris

Apache Flink CDC 3.1.0 发布公告

实时计算 Flink版操作报错之遇到错误org.apache.flink.table.api.ValidationException: Could not find any factory for identifier 'jdbc'，该如何解决

实时计算 Flink版操作报错之Apache Flink中的SplitFetcher线程在读取数据时遇到了未预期的情况，该怎么解决

unbuntu搭建LAMP（Apache2+PHP+MySQL+phpmyadmin）

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

Apache Flink 入门到实战 - Flink开源社区出品

大数据实时计算框架Spark快速入门

Apache Flink 入门

相关电子书

更多

Apache Flink技术进阶

Apache Spark: Cloud and On-Prem

Hybrid Cloud and Apache Spark

推荐镜像

更多

apache

下一篇

【DataEase】零代码数据可视化分析工具的安装部署保姆级教程