Hadoop运行模式(四)、配置历史服务器、配置日志的聚集、删除HDFS上已经存在的文件、集群启动/停止方式总结、配置mapred-site.xml、配置yarn-site.xml

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: Hadoop运行模式(四)、配置历史服务器、配置日志的聚集、删除HDFS上已经存在的文件、集群启动/停止方式总结、配置mapred-site.xml、配置yarn-site.xml

@[toc]

3.Hadoop运行模式

3.6配置历史服务器

为了查看程序的历史运行情况,需要配置一下历史服务器。具体配置步骤如下:

3.6.1配置mapred-site.xml

配置前记得将yarn关闭

  • [summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh
  • [summer@hadoop102 hadoop]$ vim mapred-site.xml

在这里插入图片描述
在该文件里面增加如下配置

<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop102:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop102:19888</value>
</property>

3.6.2分发配置

  • [summer@hadoop102 hadoop]$ xsync mapred-site.xml

在这里插入图片描述

3.6.3启动yarn

  • [summer@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

记得是在hadoop103上启动

3.6.4在hadoop102启动历史服务器

  • [summer@hadoop102 hadoop-3.1.3]$ bin/mapred --daemon start historyserver

3.6.5查看历史服务器是否启动

  • [summer@hadoop102 hadoop-3.1.3]$ jps

在这里插入图片描述
有这个就说明历史服务器启动成功了

3.6.6查看JobHistory

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
完成了!

3.7配置日志的聚集

日志聚集概念:应用运行完成以后,将程序运行日志信息上传到HDFS系统上

在这里插入图片描述

日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。
注意:开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryServer。

开启日志聚集功能具体步骤如下:

3.7.1配置yarn-site.xml

在这里插入图片描述
在这里插入图片描述
当出现这个是时候是说明日志还没有配置

  • [summer@hadoop102 hadoop]$ vim yarn-site.xml

在这里插入图片描述
在该文件里面增加如下配置

<!-- 开启日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>  
    <name>yarn.log.server.url</name>  
    <value>http://hadoop102:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

3.7.2分发配置

  • [summer@hadoop102 hadoop]$ xsync yarn-site.xml

3.7.3关闭NodeManager 、ResourceManager和HistoryServer

  • [summer@hadoop102 hadoop]$ mapred --daemon stop historyserver
  • [summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh

3.7.4启动NodeManager 、ResourceManage和HistoryServer

  • [summer@hadoop102 hadoop-3.1.3]$ mapred --daemon start historyserver
  • [summer@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

3.7.5删除HDFS上已经存在的文件

在这里插入图片描述

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /output

Deleted /output

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /testoutput

Deleted /testoutput

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /output1

Deleted /output1

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /jdk-8u212-linux-x64.tar.gz

Deleted /jdk-8u212-linux-x64.tar.gz

在这里插入图片描述

3.7.6执行WordCount程序

因为刚配置好日志,所以需要再次执行wordcount程序才可以看到日志文件

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /testinput /output1

3.7.7查看日志

在这里插入图片描述
再次点击logs就会出现这种情况

3.8集群启动/停止方式总结

3.8.1各个模块分开启动/停止(配置ssh是前提)常用

3.8.1.1整体启动/停止HDFS

start-dfs.sh/stop-dfs.sh

3.8.1.2整体启动/停止YARN

start-yarn.sh/stop-yarn.sh

3.8.2各个服务组件逐一启动/停止

当在一台服务器上不小心杀死一个JobHistoryServer、NodeManager、DataNode、NameNode的某一个,可以使用下面的方法来启动,用上面的方法的话还需要将每台都关闭再整体启动,而下面的方式则不用。

3.8.2.1分别启动/停止HDFS组件

hdfs --daemon start/stop namenode/datanode/secondarynamenode

3.8.2.2启动/停止YARN

yarn --daemon start/stop resourcemanager/nodemanager

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
11月前
|
存储 关系型数据库 数据库
【赵渝强老师】PostgreSQL的服务器日志文件
本文介绍了PostgreSQL数据库的物理存储结构,重点讨论了服务器日志文件。通过`pg_ctl`命令启动PostgreSQL实例时,使用`-l`参数指定日志文件位置,记录数据库启动、运行及关闭过程中的关键信息。附有相关视频讲解和日志文件示例。
305 0
|
4月前
|
机器学习/深度学习 存储 监控
内部文件审计:企业文件服务器审计对网络安全提升有哪些帮助?
企业文件服务器审计是保障信息安全、确保合规的关键措施。DataSecurity Plus 是由卓豪ManageEngine推出的审计工具,提供全面的文件访问监控、实时异常告警、用户行为分析及合规报告生成功能,助力企业防范数据泄露风险,满足GDPR、等保等多项合规要求,为企业的稳健发展保驾护航。
132 0
|
2月前
|
运维 监控 安全
EventLog Analyzer:高效的Web服务器日志监控与审计解决方案
ManageEngine EventLog Analyzer是一款企业级Web服务器日志监控与审计工具,支持Apache、IIS、Nginx等主流服务器,实现日志集中管理、实时威胁检测、合规报表生成及可视化分析,助力企业应对安全攻击与合规挑战,提升运维效率。
182 0
|
4月前
|
安全 Linux Shell
使用SCP命令在CentOS 7上向目标服务器传输文件
以上步骤是在CentOS 7系统上使用SCP命令进行文件传输的基础,操作简洁,易于理解。务必在执行命令前确认好各项参数,尤其是目录路径和文件名,以避免不必要的传输错误。
510 17
|
4月前
|
自然语言处理 Unix Linux
解决服务器中Jupyter笔记本的文件名字符编码问题
通过上述步骤,可以有效解决Jupyter笔记本的文件名字符编码问题,确保所有文件能在服务器上正常访问并交互,避免因编码问题引起的混淆和数据丢失。在处理任何编码问题时,务必谨慎并确保备份,因为文件名变更是
189 17
|
4月前
|
安全 Linux 网络安全
Python极速搭建局域网文件共享服务器:一行命令实现HTTPS安全传输
本文介绍如何利用Python的http.server模块,通过一行命令快速搭建支持HTTPS的安全文件下载服务器,无需第三方工具,3分钟部署,保障局域网文件共享的隐私与安全。
993 0
|
7月前
|
Python
使用Python实现multipart/form-data文件接收的http服务器
至此,使用Python实现一个可以接收 'multipart/form-data' 文件的HTTP服务器的步骤就讲解完毕了。希望通过我的讲解,你可以更好地理解其中的逻辑,另外,你也可以尝试在实际项目中运用这方面的知识。
360 69
|
Java
java小工具util系列5:java文件相关操作工具,包括读取服务器路径下文件,删除文件及子文件,删除文件夹等方法
java小工具util系列5:java文件相关操作工具,包括读取服务器路径下文件,删除文件及子文件,删除文件夹等方法
237 9
|
7月前
|
存储 监控 API
【Azure App Service】分享使用Python Code获取App Service的服务器日志记录管理配置信息
本文介绍了如何通过Python代码获取App Service中“Web服务器日志记录”的配置状态。借助`azure-mgmt-web` SDK,可通过初始化`WebSiteManagementClient`对象、调用`get_configuration`方法来查看`http_logging_enabled`的值,从而判断日志记录是否启用及存储方式(关闭、存储或文件系统)。示例代码详细展示了实现步骤,并附有执行结果与官方文档参考链接,帮助开发者快速定位和解决问题。
238 22
|
9月前
|
弹性计算 Ubuntu Linux
一键部署OpenWebUI+Ollama到阿里云ECS,轻松运行DeepSeek!(保姆级教程)
在当今数据驱动的时代,快速部署和管理大模型成为企业的关键需求。阿里云提供了一键部署OpenWebUI+Ollama的便捷方案,支持本地大模型运行和管理。用户也可以选择连接阿里云百炼的在线模型。
一键部署OpenWebUI+Ollama到阿里云ECS,轻松运行DeepSeek!(保姆级教程)

热门文章

最新文章