Hadoop运行模式(四)、配置历史服务器、配置日志的聚集、删除HDFS上已经存在的文件、集群启动/停止方式总结、配置mapred-site.xml、配置yarn-site.xml

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。注意:开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryServer、关闭NodeManager 、ResourceManager和HistoryServer、启动NodeManager 、ResourceManage和HistoryServer、各个模块分开启动/停止(配置ssh是前提)常用、整体启动/停止HDFS、整体启动/停止YARN、各个服务组件逐一启动/停止、分别启动/停止HDFS组件

3.Hadoop运行模式

3.6配置历史服务器

为了查看程序的历史运行情况,需要配置一下历史服务器。具体配置步骤如下:

3.6.1配置mapred-site.xml

配置前记得将yarn关闭

  • [summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh
  • [summer@hadoop102 hadoop]$ vim mapred-site.xml

在这里插入图片描述
在该文件里面增加如下配置

<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop102:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop102:19888</value>
</property>

3.6.2分发配置

  • [summer@hadoop102 hadoop]$ xsync mapred-site.xml

在这里插入图片描述

3.6.3启动yarn

  • [summer@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

记得是在hadoop103上启动

3.6.4在hadoop102启动历史服务器

  • [summer@hadoop102 hadoop-3.1.3]$ bin/mapred --daemon start historyserver

3.6.5查看历史服务器是否启动

  • [summer@hadoop102 hadoop-3.1.3]$ jps

在这里插入图片描述
有这个就说明历史服务器启动成功了

3.6.6查看JobHistory

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
完成了!

3.7配置日志的聚集

日志聚集概念:应用运行完成以后,将程序运行日志信息上传到HDFS系统上

在这里插入图片描述

日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。
注意:开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryServer。

开启日志聚集功能具体步骤如下:

3.7.1配置yarn-site.xml

在这里插入图片描述
在这里插入图片描述
当出现这个是时候是说明日志还没有配置

  • [summer@hadoop102 hadoop]$ vim yarn-site.xml

在这里插入图片描述
在该文件里面增加如下配置

<!-- 开启日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>  
    <name>yarn.log.server.url</name>  
    <value>http://hadoop102:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

3.7.2分发配置

  • [summer@hadoop102 hadoop]$ xsync yarn-site.xml

3.7.3关闭NodeManager 、ResourceManager和HistoryServer

  • [summer@hadoop102 hadoop]$ mapred --daemon stop historyserver
  • [summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh

3.7.4启动NodeManager 、ResourceManage和HistoryServer

  • [summer@hadoop102 hadoop-3.1.3]$ mapred --daemon start historyserver
  • [summer@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

3.7.5删除HDFS上已经存在的文件

在这里插入图片描述

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /output

Deleted /output

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /testoutput

Deleted /testoutput

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /output1

Deleted /output1

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /jdk-8u212-linux-x64.tar.gz

Deleted /jdk-8u212-linux-x64.tar.gz

在这里插入图片描述

3.7.6执行WordCount程序

因为刚配置好日志,所以需要再次执行wordcount程序才可以看到日志文件

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /testinput /output1

3.7.7查看日志

在这里插入图片描述
再次点击logs就会出现这种情况

3.8集群启动/停止方式总结

3.8.1各个模块分开启动/停止(配置ssh是前提)常用

3.8.1.1整体启动/停止HDFS

start-dfs.sh/stop-dfs.sh

3.8.1.2整体启动/停止YARN

start-yarn.sh/stop-yarn.sh

3.8.2各个服务组件逐一启动/停止

当在一台服务器上不小心杀死一个JobHistoryServer、NodeManager、DataNode、NameNode的某一个,可以使用下面的方法来启动,用上面的方法的话还需要将每台都关闭再整体启动,而下面的方式则不用。

3.8.2.1分别启动/停止HDFS组件

hdfs --daemon start/stop namenode/datanode/secondarynamenode

3.8.2.2启动/停止YARN

yarn --daemon start/stop resourcemanager/nodemanager

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
4月前
|
Java Apache 开发工具
【Azure 事件中心】 org.slf4j.Logger 收集 Event Hub SDK(Java) 输出日志并以文件形式保存
【Azure 事件中心】 org.slf4j.Logger 收集 Event Hub SDK(Java) 输出日志并以文件形式保存
|
19天前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
本文介绍了MySQL InnoDB存储引擎中的数据文件和重做日志文件。数据文件包括`.ibd`和`ibdata`文件,用于存放InnoDB数据和索引。重做日志文件(redo log)确保数据的可靠性和事务的持久性,其大小和路径可由相关参数配置。文章还提供了视频讲解和示例代码。
129 11
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
|
19天前
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的控制文件与归档日志文件
本文介绍了Oracle数据库中的控制文件和归档日志文件。控制文件记录了数据库的物理结构信息,如数据库名、数据文件和联机日志文件的位置等。为了保护数据库,通常会进行控制文件的多路复用。归档日志文件是联机重做日志文件的副本,用于记录数据库的变更历史。文章还提供了相关SQL语句,帮助查看和设置数据库的日志模式。
【赵渝强老师】Oracle的控制文件与归档日志文件
|
19天前
|
Oracle 关系型数据库 数据库
【赵渝强老师】Oracle的参数文件与告警日志文件
本文介绍了Oracle数据库的参数文件和告警日志文件。参数文件分为初始化参数文件(PFile)和服务器端参数文件(SPFile),在数据库启动时读取并分配资源。告警日志文件记录了数据库的重要活动、错误和警告信息,帮助诊断问题。文中还提供了相关视频讲解和示例代码。
|
2月前
|
监控 Linux 应用服务中间件
系统监控:使用日志文件 journalctl的使用
本文介绍了如何使用`journalctl`命令来监控和查看Linux系统的日志文件,包括查看特定行数、过滤日志级别、实时跟踪日志、按时间段查询日志以及日志轮换和压缩的配置。
57 2
系统监控:使用日志文件 journalctl的使用
|
2月前
|
SQL 数据库
为什么 SQL 日志文件很大,我应该如何处理?
为什么 SQL 日志文件很大,我应该如何处理?
|
2月前
|
SQL 存储 分布式计算
Hadoop-16-Hive HiveServer2 HS2 允许客户端远程执行HiveHQL HCatalog 集群规划 实机配置运行
Hadoop-16-Hive HiveServer2 HS2 允许客户端远程执行HiveHQL HCatalog 集群规划 实机配置运行
46 3
|
2月前
|
开发工具 git
git显示开发日志+WinSW——将.exe文件注册为服务的一个工具+图床PicGo+kubeconfig 多个集群配置 如何切换
git显示开发日志+WinSW——将.exe文件注册为服务的一个工具+图床PicGo+kubeconfig 多个集群配置 如何切换
39 1
|
2月前
|
存储 监控 固态存储
如何监控和优化 WAL 日志文件的存储空间使用?
如何监控和优化 WAL 日志文件的存储空间使用?
|
2月前
|
SQL 数据库
为什么SQL日志文件很大,该如何处理?
为什么SQL日志文件很大,该如何处理?