Hadoop服务快速部署(下)

简介: Hadoop服务快速部署(下)

从日志中可以看到这些关键信息


客户端连接ResourceManager资源管理器 对应端口是8032
client.RMProxy: Connecting to ResourceManager at /0.0.0.0:8032
提交一个mapreduce任务到 8088端口
mapreduce.Job: The url to track the job: http://529923fd985e:8088/proxy/application_1603590135211_0004/


查看计算结果


bin/hdfs dfs -cat output/*


image.png


image.png


安装hadoop 3.0.0


安装hadoop 3.1.1集群


一键启动脚本


https://gitee.com/pingfanrenbiji/docker-hadoop


image.png


进入master容器


docker exec -it master sh


格式化hdfs


hadoop namenode -format


image.png


启动hadoop


cd /usr/local/hadoop-3.1.1/sbin
./start-all.sh


image.png


image.png


image.png


启动docker服务


# 启动hadoop 3.2.0
docker run --rm --name hadoop -p 9870:9870 -p 9864:9864 -d crs4/hadoop:3.2.0
# 进入docker
docker exec -it hadoop bash -l
# 创建一个目录
hdfs dfs -mkdir -p "/user/$(whoami)"
# 上传文件
hdfs dfs -put entrypoint.sh
# 打印hadoop版本
export V=$(hadoop version | head -n 1 | awk '{print $2}')
# 提交hadoop任务
hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-${V}.jar wordcount entrypoint.sh wc_out
# 运行hadoop任务
hdfs dfs -get wc_out
# 获取计算结果
head wc_out/part*


通过docker-compose启动


docker-compose up -d


image.png


进入client


docker-compose exec client bash
hdfs dfs -mkdir -p "/user/$(whoami)"
相关文章
|
3天前
|
分布式计算 资源调度 Hadoop
重启Hadoop服务
【4月更文挑战第18天】重启Hadoop服务涉及五个步骤:1) 停止所有服务,如使用`stop-all.sh`;2) 检查服务是否停止,通过jps命令;3) 清理临时数据和日志;4) 使用`start-all.sh`重启服务;5) 再次用jps确认服务启动。注意,步骤依Hadoop版本和配置而异,操作前需谨慎并参考官方文档,以防影响运行中的应用程序。
10 2
|
4月前
|
分布式计算 资源调度 Hadoop
Hadoop【部署 02】hadoop-3.1.3 单机版YARN(配置、启动停止shell脚本修改及服务验证)
Hadoop【部署 02】hadoop-3.1.3 单机版YARN(配置、启动停止shell脚本修改及服务验证)
55 0
|
存储 SQL 弹性计算
手把手教你使用自建Hadoop访问全托管服务化HDFS(OSS-HDFS服务)
1. 服务介绍OSS-HDFS服务(JindoFS 服务)是一款云原生数据湖3.0存储产品,基于统一的元数据管理能力,在完全兼容 HDFS 文件系统接口的同时,提供充分的 POSIX 能力支持,能更好的满足大数据和 AI 领域丰富多样的数据湖计算场景。通过OSS-HDFS服务,无需对现有的 Hadoop/Spark 大数据分析应用做任何修改,通过简单的配置就可以像在原生HDFS中那样管理和访问数据
手把手教你使用自建Hadoop访问全托管服务化HDFS(OSS-HDFS服务)
|
存储 分布式计算 资源调度
平台服务 开源 Hadoop|学习笔记
快速学习平台服务 开源 Hadoop
137 0
平台服务 开源 Hadoop|学习笔记
|
机器学习/深度学习 SQL 分布式计算
规划为 Hadoop 中各个服务分配 Kerberos 的 principal|学习笔记
快速学习规划为 Hadoop 中各个服务分配 Kerberos 的 principal
205 0
|
资源调度 分布式计算 数据可视化
集成 Hadoop 服务—页面操作使用 | 学习笔记
快速学习 集成 Hadoop 服务—页面操作使用
95 0
集成 Hadoop 服务—页面操作使用 | 学习笔记
|
存储 资源调度 分布式计算
集成 Hadoop 服务(HDFS、YARN)| 学习笔记
快速学习 集成 Hadoop 服务(HDFS、YARN)
129 0
集成 Hadoop 服务(HDFS、YARN)| 学习笔记
|
分布式计算 Hadoop Docker
Hadoop服务快速部署(上)
Hadoop服务快速部署(上)
220 0
Hadoop服务快速部署(上)
|
云安全 分布式计算 资源调度
TeamTNT变种攻击Hadoop集群,云上服务对外开放需谨慎
近日,阿里云安全监测到TeamTNT变种,除了沿用之前攻击手法,最新利用了Hadoop Yarn未授权访问漏洞进行传播,同时使用多个域名和IP确保恶意文件落地,对脚本进行二进制化封装以对抗主机端检测。
543 0
TeamTNT变种攻击Hadoop集群,云上服务对外开放需谨慎
|
15天前
|
存储 分布式计算 Hadoop
大数据处理架构Hadoop
【4月更文挑战第10天】Hadoop是开源的分布式计算框架,核心包括MapReduce和HDFS,用于海量数据的存储和计算。具备高可靠性、高扩展性、高效率和低成本优势,但存在低延迟访问、小文件存储和多用户写入等问题。运行模式有单机、伪分布式和分布式。NameNode管理文件系统,DataNode存储数据并处理请求。Hadoop为大数据处理提供高效可靠的解决方案。
37 2

相关实验场景

更多