Hadoop服务快速部署(上)

简介: Hadoop服务快速部署(上)


这篇文章记录下针对不同的hadoop版本进行服务部署的过程,希望可以帮到你们


  • 安装docker hadoop2.7.0


  • 一键部署docker hadoop3.0.0集群(一个master 三个slave)


  • 安装docker hadoop 3.2.0



a、docker启动


b、docker compose方式启动


安装hadoop 2.7.0版本


安装命令


docker run --name hdfs2.7.3 -d -p 9000:9000 -p 50070:50070 georocket/hadoop-docker:2.7.3


50070是webui端口


9000是hdfs服务端口


查看启动结果


docker logs -f 529923fd985e65c6aa1dab32b51acfc3bb4de94042b9079b8d1e62e760766821
从日志中可以看出 启动方式-启动用户-启动服务
hadoop-root-namenode
hadoop-root-datanode
hadoop-root-secondarynamenode
yarn--resourcemanager
yarn-root-nodemanager 
mapred--historyserver


image.png


hadoop相关端口


docker ps|grep hadoop
529923fd985e  georocket/hadoop-docker:2.7.3   "/etc/bootstrap.sh -d"   36 minutes ago      Up 36 minutes       2122/tcp, 8020/tcp, 8030-8033/tcp, 8040/tcp, 8042/tcp, 8088/tcp, 10020/tcp, 19888/tcp, 49707/tcp, 50010/tcp, 0.0.0.0:9000->9000/tcp, 50020/tcp, 50075/tcp, 50090/tcp, 0.0.0.0:50070->50070/tcp   hdfs2.7.3


微信图片_20220423221019.png


进入docker中 运行hadoop mapreduce


docker exec -it 529923fd985e65c6aa1dab32b51acfc3bb4de94042b9079b8d1e62e760766821 sh
进入hadoop目录
cd $HADOOP_PREFIX


执行mapreduce程序


bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output 'dfs[a-z.]+'
计算结果保存在了 hdfs://529923fd985e:9000/user/root/output


image.png



相关文章
|
1月前
|
分布式计算 资源调度 Hadoop
重启Hadoop服务
【4月更文挑战第18天】重启Hadoop服务涉及五个步骤:1) 停止所有服务,如使用`stop-all.sh`;2) 检查服务是否停止,通过jps命令;3) 清理临时数据和日志;4) 使用`start-all.sh`重启服务;5) 再次用jps确认服务启动。注意,步骤依Hadoop版本和配置而异,操作前需谨慎并参考官方文档,以防影响运行中的应用程序。
23 2
|
1月前
|
分布式计算 资源调度 Hadoop
Hadoop【部署 02】hadoop-3.1.3 单机版YARN(配置、启动停止shell脚本修改及服务验证)
Hadoop【部署 02】hadoop-3.1.3 单机版YARN(配置、启动停止shell脚本修改及服务验证)
77 0
|
存储 SQL 弹性计算
手把手教你使用自建Hadoop访问全托管服务化HDFS(OSS-HDFS服务)
1. 服务介绍OSS-HDFS服务(JindoFS 服务)是一款云原生数据湖3.0存储产品,基于统一的元数据管理能力,在完全兼容 HDFS 文件系统接口的同时,提供充分的 POSIX 能力支持,能更好的满足大数据和 AI 领域丰富多样的数据湖计算场景。通过OSS-HDFS服务,无需对现有的 Hadoop/Spark 大数据分析应用做任何修改,通过简单的配置就可以像在原生HDFS中那样管理和访问数据
手把手教你使用自建Hadoop访问全托管服务化HDFS(OSS-HDFS服务)
|
存储 分布式计算 资源调度
平台服务 开源 Hadoop|学习笔记
快速学习平台服务 开源 Hadoop
143 0
平台服务 开源 Hadoop|学习笔记
|
机器学习/深度学习 SQL 分布式计算
规划为 Hadoop 中各个服务分配 Kerberos 的 principal|学习笔记
快速学习规划为 Hadoop 中各个服务分配 Kerberos 的 principal
225 0
|
资源调度 分布式计算 数据可视化
集成 Hadoop 服务—页面操作使用 | 学习笔记
快速学习 集成 Hadoop 服务—页面操作使用
102 0
集成 Hadoop 服务—页面操作使用 | 学习笔记
|
存储 资源调度 分布式计算
集成 Hadoop 服务(HDFS、YARN)| 学习笔记
快速学习 集成 Hadoop 服务(HDFS、YARN)
158 0
集成 Hadoop 服务(HDFS、YARN)| 学习笔记
|
分布式计算 Hadoop Docker
Hadoop服务快速部署(下)
Hadoop服务快速部署(下)
227 0
Hadoop服务快速部署(下)
|
云安全 分布式计算 资源调度
TeamTNT变种攻击Hadoop集群,云上服务对外开放需谨慎
近日,阿里云安全监测到TeamTNT变种,除了沿用之前攻击手法,最新利用了Hadoop Yarn未授权访问漏洞进行传播,同时使用多个域名和IP确保恶意文件落地,对脚本进行二进制化封装以对抗主机端检测。
546 0
TeamTNT变种攻击Hadoop集群,云上服务对外开放需谨慎
|
4天前
|
存储 分布式计算 Hadoop
大数据之hadoop3入门到精通(一)
大数据之hadoop3入门到精通(一)

相关实验场景

更多