征文投稿丨使用轻量应用服务器部署Hadoop云集群

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
简介: Hadoop3.x的伪分布式方法部署云集群

编者按:本文来自轻量应用服务器征文活动用户投稿,已获得作者(昵称Maynor大数据)授权发布。


由于我在工作学习中经常需要使用到Hadoop集群,而本地Hadoop有启动速度慢、操作麻烦和占用内存等痛点。最近在和粉丝的交流中,一位提到的伪分布式部署Hadoop的概念启发了我。正好领取的服务器还没开始用,何不用来部署云集群?以下为具体的部署过程,我选择的是Hadoop3.x的伪分布式部署方法。


1、领取轻量应用服务器

阿里云的产品活动还是很给力的,遇到像双11这样的大促活动,甚至可以做到免费获得服务器。如果你是学生,买轻量应用服务器还是很便宜的,只需要9元/月, 也可以参与阿里云开发者成长计划。

image005-裁剪.png


2、服务器选择和配置

这里选择的是轻量应用服务器,系统镜像和应用镜像不需要改变,保持默认值就行(WordPress, CentOS 7.3)。

image007-裁剪.jpg


这里需要设置root权限和密码

设置成功后通过本地terminal(MAC)或者cmd(Windows)来构建ssh:

ssh root@****

然后输入之前设置的root的权限密码(注意:这里的密码是不会有任何显示的)

image009.png


若出现上图的情况,需要清理一下之前的key:

ssh-keygen -R XX.XX.XX.XX

然后再次用ssh连接,然后yes,到此我们进入到了阿里云的服务器。

image.gifimage011.png


3、配置java环境

首先下载java的jdk:


wget https://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz


然后解压:


tar -zxvf openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz


移动位置并且配置java路径:


mv java-se-8u41-ri/ /usr/java8
echo 'export JAVA_HOME=/usr/java8' >> /etc/profile
echo 'export PATH=$PATH:$JAVA_HOME/bin' >> /etc/profile
source /etc/profile


检查是否安装成功:


java -version


若安装成功会出现如下结果:

image013.png


4、进行Hadoop的安装

这个是清华的镜像源,国内的小伙伴下载比较快:


# 借助清华源下载Hadoop
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-3.2.2/hadoop-3.2.2.tar.gz


按照惯例解压:


tar -zxvf hadoop-3.2.2.tar.gz -C /opt/
mv /opt/hadoop-3.2.2 /opt/hadoop


配置地址:


echo 'export HADOOP_HOME=/opt/hadoop/' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/bin' >> /etc/profile
echo 'export PATH=$PATH:$HADOOP_HOME/sbin' >> /etc/profile
source /etc/profile


配置yarn和hadoop:


echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/yarn-env.sh
echo "export JAVA_HOME=/usr/java8" >> /opt/hadoop/etc/hadoop/hadoop-env.sh


查看Hadoop 安装情况:


hadoop version


若出现下图情况,则说明安装成功。

image015.png


5、利用vim来操作core-site 和 hdfs-site

输入以下命令:


vim /opt/hadoop/etc/hadoop/core-site.xml


进入vim环境,如下图示:

image017.png


按下i(insert)修改

光标移动至configuration之间,复制如下的信息:


<property>        
    <name>hadoop.tmp.dir</name>        
    <value>file:/opt/hadoop/tmp</value>        
    <description>location to store temporary files</description>    
  </property>    
  <property>        
    <name>fs.defaultFS</name>        
    <value>hdfs://localhost:9000</value>    
  </property>


然后按下esc,停止修改,然后打":wq"(实际无“”)退出vim修改。

同理,操作hdfs-site

输入命令行:


vim /opt/hadoop/etc/hadoop/hdfs-site.xml


移动光标,复制以下信息:


<property>
    <name>dfs.replication</name>
    <value>1</value>    
  </property>    
  <property>        
    <name>dfs.namenode.name.dir</name>        
    <value>file:/opt/hadoop/tmp/dfs/name</value>    
  </property>    
  <property>        
    <name>dfs.datanode.data.dir</name>        
    <value>file:/opt/hadoop/tmp/dfs/data</value>    
  </property>


配置master和slave连接,运行如下指令,并且一直回车,直至出现如下图:

ssh-keygen -t rsa

image018.png


运行如下代码:


cd .ssh
cat id_rsa.pub >> authorized_keys


启动Hadoop:


hadoop namenode -format
start-dfs.sh
start-yarn.sh


踩坑提醒:

ERROR: but there is no YARN_NODEMANAGER_USER defined. Aborting operation

这里踩了一个小坑,出现如上面的错误提示,解决方案参考:

https://blog.csdn.net/ystyaoshengting/article/details/103026872


查看是否配置成功:

jps


配置成功图如下:

image020.png


6、配置防火墙端口

接下来需要开启你在阿里云的防火墙端口,才可以在浏览器上访问,否则你怎么弄都是访问不到。

image021-打码.png


最后你就可以在浏览器输入XX.XX.XX.XX:9870 或者XX.XX.XX.XX:8088来在浏览器上访问你的Hadoop,效果图如下:

image023-裁剪.png

image025-裁剪.png


以上就是使用Hadoop3.x的伪分布式部署方法,利用轻量应用服务器部署云集群的全过程,希望对你有所帮助。


点击我要投稿,查看全新升级的轻量应用服务器征文活动,奖励提升,每月都可以投稿。

相关文章
|
22天前
|
弹性计算 安全 Linux
使用阿里云服务器安装Z-Blog博客网站流程,新手一键部署教程
本教程教你如何在阿里云99元服务器上,通过宝塔Linux面板一键部署Z-Blog博客。基于CentOS 7.9系统,从远程连接、安装宝塔面板、开放端口到部署Z-Blog全流程详解,操作简单,新手也能轻松搭建个人博客网站。
270 13
|
22天前
|
弹性计算 Devops Shell
用阿里云 DevOps Flow 实现 ECS 部署自动化:从准备到落地的完整指南
阿里云 DevOps Flow 是一款助力开发者实现自动化部署的高效工具,支持代码流水线构建、测试与部署至ECS实例,显著提升交付效率与稳定性。本文详解如何通过 Flow 自动部署 Bash 脚本至 ECS,涵盖环境准备、流水线搭建、源码接入、部署流程设计及结果验证,助你快速上手云上自动化运维。
86 0
监控 安全 Linux
45 0
|
2月前
|
监控 Java Linux
Apache NiFi项目的编译与部署于CentOS服务器
总而言之,Apache NiFi的编译和部署虽然涉及多个步骤,但这些操作步骤简明扼要,即使是不太熟悉Java或Maven的用户也能跟随指南完成。通过遵循上述步骤,您将能够在CentOS服务器上成功部署Apache NiFi,为您的数据流处理任务建立一个功能强大的平台。
145 16
|
2月前
|
资源调度 负载均衡 JavaScript
使用PM2工具部署Vue.js应用于服务器
以上步骤完成之后,你就成功利⽤ PM⼆工具将 Vuejs 应⽰程序部署至服 务 器,并且配合反向代理实现了高效稳定访问及负载均衡功能。
100 0
|
2月前
|
运维 数据可视化 数据库
一小时搞定服务器软件部署:资深工程师实测方案
本文分享了一位运维工程师在短时间内将30个不同软件部署到新服务器上的实战经验。面对全新 Rocky Linux 系统,传统手工部署方式效率低下且容易出错。作者尝试多种自动化方案后,最终选择使用自动化部署工具,通过其内置的 Docker Compose 模板和可视化界面,实现快速、批量部署,大幅提升效率,30个应用仅用约1小时完成,显著节省时间和人力成本。
|
2月前
|
Java 关系型数据库 应用服务中间件
零基础服务器搭建教程:30分钟快速部署你的第一台服务器
入职小白突遭“下马威”,首周被要求搭建包含 Odoo ERP、NGINX、MySQL 和 Java 应用的服务器,却从零基础开始摸索,历经系统配置、软件安装、服务部署等重重难关。在时间紧、技术难的困境中,意外发现一键部署工具 ,借助其自动化能力快速完成任务,不仅赢得老板认可,也开启了自主学习之路:从 systemd 到 NGINX 配置,从 Odoo 结构到 Shell 脚本编写,逐步成长为“能搭服务器的人”。
零基础服务器搭建教程:30分钟快速部署你的第一台服务器
|
2月前
|
运维 Prometheus 监控
3 年部署经验总结:用自动化工具轻松管理 300+ 服务器开源软件
三年前接手公司IT部门时,我满怀信心,却发现部署效率低下。尽管使用了GitLab、Jenkins、Zabbix等100+开源工具,部署仍耗时费力。文档厚重如百科,却难解实际困境。一次凌晨三点的加班让我下定决心改变现状。偶然看到一篇国外博客,介绍了自动化部署的高效方式,我深受启发。
128 0

热门文章

最新文章

相关产品

  • 云服务器 ECS
  • 轻量应用服务器