Hadoop运行模式(四)、配置历史服务器、配置日志的聚集、删除HDFS上已经存在的文件、集群启动/停止方式总结、配置mapred-site.xml、配置yarn-site.xml

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。注意:开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryServer、关闭NodeManager 、ResourceManager和HistoryServer、启动NodeManager 、ResourceManage和HistoryServer、各个模块分开启动/停止(配置ssh是前提)常用、整体启动/停止HDFS、整体启动/停止YARN、各个服务组件逐一启动/停止、分别启动/停止HDFS组件

3.Hadoop运行模式

3.6配置历史服务器

为了查看程序的历史运行情况,需要配置一下历史服务器。具体配置步骤如下:

3.6.1配置mapred-site.xml

配置前记得将yarn关闭

  • [summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh
  • [summer@hadoop102 hadoop]$ vim mapred-site.xml

在这里插入图片描述
在该文件里面增加如下配置

<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop102:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop102:19888</value>
</property>

3.6.2分发配置

  • [summer@hadoop102 hadoop]$ xsync mapred-site.xml

在这里插入图片描述

3.6.3启动yarn

  • [summer@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

记得是在hadoop103上启动

3.6.4在hadoop102启动历史服务器

  • [summer@hadoop102 hadoop-3.1.3]$ bin/mapred --daemon start historyserver

3.6.5查看历史服务器是否启动

  • [summer@hadoop102 hadoop-3.1.3]$ jps

在这里插入图片描述
有这个就说明历史服务器启动成功了

3.6.6查看JobHistory

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
完成了!

3.7配置日志的聚集

日志聚集概念:应用运行完成以后,将程序运行日志信息上传到HDFS系统上

在这里插入图片描述

日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。
注意:开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryServer。

开启日志聚集功能具体步骤如下:

3.7.1配置yarn-site.xml

在这里插入图片描述
在这里插入图片描述
当出现这个是时候是说明日志还没有配置

  • [summer@hadoop102 hadoop]$ vim yarn-site.xml

在这里插入图片描述
在该文件里面增加如下配置

<!-- 开启日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>  
    <name>yarn.log.server.url</name>  
    <value>http://hadoop102:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

3.7.2分发配置

  • [summer@hadoop102 hadoop]$ xsync yarn-site.xml

3.7.3关闭NodeManager 、ResourceManager和HistoryServer

  • [summer@hadoop102 hadoop]$ mapred --daemon stop historyserver
  • [summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh

3.7.4启动NodeManager 、ResourceManage和HistoryServer

  • [summer@hadoop102 hadoop-3.1.3]$ mapred --daemon start historyserver
  • [summer@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

3.7.5删除HDFS上已经存在的文件

在这里插入图片描述

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /output

Deleted /output

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /testoutput

Deleted /testoutput

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /output1

Deleted /output1

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /jdk-8u212-linux-x64.tar.gz

Deleted /jdk-8u212-linux-x64.tar.gz

在这里插入图片描述

3.7.6执行WordCount程序

因为刚配置好日志,所以需要再次执行wordcount程序才可以看到日志文件

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /testinput /output1

3.7.7查看日志

在这里插入图片描述
再次点击logs就会出现这种情况

3.8集群启动/停止方式总结

3.8.1各个模块分开启动/停止(配置ssh是前提)常用

3.8.1.1整体启动/停止HDFS

start-dfs.sh/stop-dfs.sh

3.8.1.2整体启动/停止YARN

start-yarn.sh/stop-yarn.sh

3.8.2各个服务组件逐一启动/停止

当在一台服务器上不小心杀死一个JobHistoryServer、NodeManager、DataNode、NameNode的某一个,可以使用下面的方法来启动,用上面的方法的话还需要将每台都关闭再整体启动,而下面的方式则不用。

3.8.2.1分别启动/停止HDFS组件

hdfs --daemon start/stop namenode/datanode/secondarynamenode

3.8.2.2启动/停止YARN

yarn --daemon start/stop resourcemanager/nodemanager

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
2月前
|
Java Apache 开发工具
【Azure 事件中心】 org.slf4j.Logger 收集 Event Hub SDK(Java) 输出日志并以文件形式保存
【Azure 事件中心】 org.slf4j.Logger 收集 Event Hub SDK(Java) 输出日志并以文件形式保存
|
2月前
|
运维 安全 Linux
【揭秘】如何轻松掌控Linux系统命脉?——一场探索日志文件奥秘的旅程,带你洞悉系统背后的故事!
【8月更文挑战第21天】日志文件对Linux系统至关重要,记录着包括应用行为、组件状态和安全事件在内的系统活动,如同系统的“黑匣子”。掌握日志查看技巧是系统管理的基础技能,有助于快速诊断问题。常用命令包括`cat`、`tail`和`grep`等,可用于查看如`/var/log/messages`和`/var/log/auth.log`等系统日志文件,以及特定应用的日志。`journalctl`则用于查看systemd服务日志。此外,`logrotate`工具可管理日志文件的滚动和归档,确保系统高效运行。
38 4
|
15天前
|
缓存 监控 算法
分析慢日志文件来优化 PHP 脚本的性能
分析慢日志文件来优化 PHP 脚本的性能
|
25天前
|
消息中间件 存储 监控
Kafka的logs目录下的文件都是什么日志?
Kafka的logs目录下的文件都是什么日志?
40 11
|
2月前
|
缓存 NoSQL Linux
【Azure Redis 缓存】Windows和Linux系统本地安装Redis, 加载dump.rdb中数据以及通过AOF日志文件追加数据
【Azure Redis 缓存】Windows和Linux系统本地安装Redis, 加载dump.rdb中数据以及通过AOF日志文件追加数据
【Azure Redis 缓存】Windows和Linux系统本地安装Redis, 加载dump.rdb中数据以及通过AOF日志文件追加数据
|
8天前
|
Python
Python如何将日志输入到文件里
Python如何将日志输入到文件里
|
2月前
|
Java 应用服务中间件 HSF
Java应用结构规范问题之配置Logback以仅记录错误级别的日志到一个滚动文件中的问题如何解决
Java应用结构规范问题之配置Logback以仅记录错误级别的日志到一个滚动文件中的问题如何解决
|
2月前
|
存储 分布式计算 算法
探索Hadoop的三种运行模式:单机模式、伪分布式模式和完全分布式模式
在配置Hadoop集群之前,了解这三种模式的特点、适用场景和配置差异是非常重要的。这有助于用户根据个人需求和资源情况,选择最适合自己的Hadoop运行模式。在最初的学习和开发阶段,单机模式和伪分布式模式能为用户提供便利和成本效益。进而,当用户要处理大规模数据集时,完全分布式模式将是理想的选择。
79 2
|
2月前
|
存储 安全 Linux
在Linux中,日志文件通常存储在哪些目录?
在Linux中,日志文件通常存储在哪些目录?
|
2月前
|
Ubuntu Linux Apache
在Linux中,如何使用logrotate命令管理日志文件?
在Linux中,如何使用logrotate命令管理日志文件?
下一篇
无影云桌面