备案控制台

开发者社区问答正文

简要描述Spark分布式集群搭建的步骤

简要描述Spark分布式集群搭建的步骤

展开

收起

茶什i 2019-10-25 16:14:11 1980 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

珍宝珠

1）准备linux环境，设置集群搭建账号和用户组，设置ssh，关闭防火墙，关闭seLinux，配置host，hostname
2）配置jdk到环境变量
3）搭建hadoop集群，如果要做master ha，需要搭建zookeeper集群修改hdfs-site.xml,hadoop_env.sh,yarn-site.xml,slaves等配置文件
4）启动hadoop集群，启动前要格式化namenode
5）配置spark集群，修改spark-env.xml，slaves等配置文件，拷贝hadoop相关配置到spark conf目录下
6)启动spark集群。

2019-10-25 16:21:45

赞同展开评论

问答分类：

分布式计算 Spark

问答标签：

分布式集群 apache spark集群分布式步骤 apache spark分布式 spark分布式

问答地址：

开发者社区 > 大数据 > 问答

相关问答

在分布式锁管理器DLM中，当集群拓扑发生变更时，leader节点会如何通知其他节点进行锁信息的重建？

138

1

0

集群增删节点时，DLM是如何控制分布式锁的路由和分配的？

112

1

0

在DLM中，当集群出现节点故障时，如何确保分布式锁能够被正常路由和分配？

103

1

0

随着分布式数据仓库集群规模增大，面临的一个主要挑战是什么？

62

1

0

serverless spark 和 emr on ack中spark集群类型区别是什么？

140

1

0

核心云原生分布式转型的实施路径和步骤是什么？

68

1

0

小米离线集群在使用Spark时面临的主要痛点是什么？

104

1

0

阿里云北美地区的Spark EMR集群不支持Serverless吗？

119

0

0

E-MapReduce集群使用notebook连接spark-sql报错The request...

133

1

0

云数据仓库ADB Spark SQL访问OSS外表-（可选）步骤五：删除外表

120

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

相关文章

XXLJOB：超长定时任务慢节点优化实践

五、Hive表类型、分区及数据加载

阿里云服务器Arm计算架构解析：主要实例规格、性能特点、适用场景与价格参考

六、Hive 分桶

九、HQL DQL七大查询子句

还有其他疑问?