Hadoop服务快速部署(上)

简介: Hadoop服务快速部署(上)


这篇文章记录下针对不同的hadoop版本进行服务部署的过程,希望可以帮到你们


  • 安装docker hadoop2.7.0


  • 一键部署docker hadoop3.0.0集群(一个master 三个slave)


  • 安装docker hadoop 3.2.0



a、docker启动


b、docker compose方式启动


安装hadoop 2.7.0版本


安装命令


docker run --name hdfs2.7.3 -d -p 9000:9000 -p 50070:50070 georocket/hadoop-docker:2.7.3


50070是webui端口


9000是hdfs服务端口


查看启动结果


docker logs -f 529923fd985e65c6aa1dab32b51acfc3bb4de94042b9079b8d1e62e760766821
从日志中可以看出 启动方式-启动用户-启动服务
hadoop-root-namenode
hadoop-root-datanode
hadoop-root-secondarynamenode
yarn--resourcemanager
yarn-root-nodemanager 
mapred--historyserver


image.png


hadoop相关端口


docker ps|grep hadoop
529923fd985e  georocket/hadoop-docker:2.7.3   "/etc/bootstrap.sh -d"   36 minutes ago      Up 36 minutes       2122/tcp, 8020/tcp, 8030-8033/tcp, 8040/tcp, 8042/tcp, 8088/tcp, 10020/tcp, 19888/tcp, 49707/tcp, 50010/tcp, 0.0.0.0:9000->9000/tcp, 50020/tcp, 50075/tcp, 50090/tcp, 0.0.0.0:50070->50070/tcp   hdfs2.7.3


微信图片_20220423221019.png


进入docker中 运行hadoop mapreduce


docker exec -it 529923fd985e65c6aa1dab32b51acfc3bb4de94042b9079b8d1e62e760766821 sh
进入hadoop目录
cd $HADOOP_PREFIX


执行mapreduce程序


bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output 'dfs[a-z.]+'
计算结果保存在了 hdfs://529923fd985e:9000/user/root/output


image.png



相关文章
|
4月前
|
分布式计算 资源调度 Hadoop
Hadoop节点资源扩展环境部署
【4月更文挑战第16天】扩展Hadoop集群涉及多个步骤:准备新节点,配置静态IP,安装并配置Hadoop,将新节点添加到集群,验证测试,及优化调整。确保符合硬件需求,更新集群节点列表,执行`hdfs dfsadmin -refreshNodes`命令,检查新节点状态,并依据测试结果优化性能。注意不同环境可能需要调整具体步骤,建议参照官方文档并在测试环境中预演。
48 4
|
17天前
|
分布式计算 资源调度 Hadoop
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(二)
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(二)
|
17天前
|
分布式计算 Ubuntu Hadoop
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(一)
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(一)
|
14天前
|
SQL 分布式计算 Hadoop
centos7通过CDH部署Hadoop
centos7通过CDH部署Hadoop
|
14天前
|
分布式计算 Java Linux
centos7通过Ambari2.74部署Hadoop
centos7通过Ambari2.74部署Hadoop
|
15天前
|
存储 分布式计算 监控
Hadoop在云计算环境下的部署策略
【8月更文第28天】Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。随着云计算技术的发展,越来越多的企业开始利用云平台的优势来部署Hadoop集群,以实现更高的可扩展性、可用性和成本效益。本文将探讨如何在公有云、私有云及混合云环境下部署和管理Hadoop集群,并提供具体的部署策略和代码示例。
37 0
|
2月前
|
分布式计算 资源调度 安全
Hadoop停止所有Hadoop服务
【7月更文挑战第20天】
37 2
|
3月前
|
分布式计算 Hadoop 网络安全
|
3月前
|
存储 分布式计算 Hadoop
|
3月前
|
分布式计算 Hadoop Java

相关实验场景

更多