Hadoop运行模式(四)、配置历史服务器、配置日志的聚集、删除HDFS上已经存在的文件、集群启动/停止方式总结、配置mapred-site.xml、配置yarn-site.xml

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: Hadoop运行模式(四)、配置历史服务器、配置日志的聚集、删除HDFS上已经存在的文件、集群启动/停止方式总结、配置mapred-site.xml、配置yarn-site.xml

@[toc]

3.Hadoop运行模式

3.6配置历史服务器

为了查看程序的历史运行情况,需要配置一下历史服务器。具体配置步骤如下:

3.6.1配置mapred-site.xml

配置前记得将yarn关闭

  • [summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh
  • [summer@hadoop102 hadoop]$ vim mapred-site.xml

在这里插入图片描述
在该文件里面增加如下配置

<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop102:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop102:19888</value>
</property>

3.6.2分发配置

  • [summer@hadoop102 hadoop]$ xsync mapred-site.xml

在这里插入图片描述

3.6.3启动yarn

  • [summer@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

记得是在hadoop103上启动

3.6.4在hadoop102启动历史服务器

  • [summer@hadoop102 hadoop-3.1.3]$ bin/mapred --daemon start historyserver

3.6.5查看历史服务器是否启动

  • [summer@hadoop102 hadoop-3.1.3]$ jps

在这里插入图片描述
有这个就说明历史服务器启动成功了

3.6.6查看JobHistory

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
完成了!

3.7配置日志的聚集

日志聚集概念:应用运行完成以后,将程序运行日志信息上传到HDFS系统上

在这里插入图片描述

日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。
注意:开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryServer。

开启日志聚集功能具体步骤如下:

3.7.1配置yarn-site.xml

在这里插入图片描述
在这里插入图片描述
当出现这个是时候是说明日志还没有配置

  • [summer@hadoop102 hadoop]$ vim yarn-site.xml

在这里插入图片描述
在该文件里面增加如下配置

<!-- 开启日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>  
    <name>yarn.log.server.url</name>  
    <value>http://hadoop102:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

3.7.2分发配置

  • [summer@hadoop102 hadoop]$ xsync yarn-site.xml

3.7.3关闭NodeManager 、ResourceManager和HistoryServer

  • [summer@hadoop102 hadoop]$ mapred --daemon stop historyserver
  • [summer@hadoop103 hadoop-3.1.3]$ sbin/stop-yarn.sh

3.7.4启动NodeManager 、ResourceManage和HistoryServer

  • [summer@hadoop102 hadoop-3.1.3]$ mapred --daemon start historyserver
  • [summer@hadoop103 hadoop-3.1.3]$ sbin/start-yarn.sh

3.7.5删除HDFS上已经存在的文件

在这里插入图片描述

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /output

Deleted /output

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /testoutput

Deleted /testoutput

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /output1

Deleted /output1

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop fs -rm -r /jdk-8u212-linux-x64.tar.gz

Deleted /jdk-8u212-linux-x64.tar.gz

在这里插入图片描述

3.7.6执行WordCount程序

因为刚配置好日志,所以需要再次执行wordcount程序才可以看到日志文件

  • [summer@hadoop102 hadoop-3.1.3]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /testinput /output1

3.7.7查看日志

在这里插入图片描述
再次点击logs就会出现这种情况

3.8集群启动/停止方式总结

3.8.1各个模块分开启动/停止(配置ssh是前提)常用

3.8.1.1整体启动/停止HDFS

start-dfs.sh/stop-dfs.sh

3.8.1.2整体启动/停止YARN

start-yarn.sh/stop-yarn.sh

3.8.2各个服务组件逐一启动/停止

当在一台服务器上不小心杀死一个JobHistoryServer、NodeManager、DataNode、NameNode的某一个,可以使用下面的方法来启动,用上面的方法的话还需要将每台都关闭再整体启动,而下面的方式则不用。

3.8.2.1分别启动/停止HDFS组件

hdfs --daemon start/stop namenode/datanode/secondarynamenode

3.8.2.2启动/停止YARN

yarn --daemon start/stop resourcemanager/nodemanager

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
3月前
|
存储 关系型数据库 数据库
【赵渝强老师】PostgreSQL的服务器日志文件
本文介绍了PostgreSQL数据库的物理存储结构,重点讨论了服务器日志文件。通过`pg_ctl`命令启动PostgreSQL实例时,使用`-l`参数指定日志文件位置,记录数据库启动、运行及关闭过程中的关键信息。附有相关视频讲解和日志文件示例。
152 0
|
3月前
|
Java
java实现从HDFS上下载文件及文件夹的功能,以流形式输出,便于用户自定义保存任何路径下
java实现从HDFS上下载文件及文件夹的功能,以流形式输出,便于用户自定义保存任何路径下
125 34
|
3月前
|
存储 SQL 关系型数据库
【赵渝强老师】PostgreSQL的运行日志文件
PostgreSQL的物理存储结构包括数据文件、日志文件等。运行日志默认未开启,需配置`postgresql.conf`文件中的相关参数如`log_destination`、`log_directory`等,以记录数据库状态、错误信息等。示例配置中启用了CSV格式日志,便于管理和分析。通过创建表操作,可查看生成的日志文件,了解具体日志内容。
124 3
|
3月前
|
存储 Prometheus 监控
Docker容器内进行应用调试与故障排除的方法与技巧,包括使用日志、进入容器检查、利用监控工具及检查配置等,旨在帮助用户有效应对应用部署中的挑战,确保应用稳定运行
本文深入探讨了在Docker容器内进行应用调试与故障排除的方法与技巧,包括使用日志、进入容器检查、利用监控工具及检查配置等,旨在帮助用户有效应对应用部署中的挑战,确保应用稳定运行。
111 5
|
5月前
|
Arthas 监控 Java
JVM知识体系学习七:了解JVM常用命令行参数、GC日志详解、调优三大方面(JVM规划和预调优、优化JVM环境、JVM运行出现的各种问题)、Arthas
这篇文章全面介绍了JVM的命令行参数、GC日志分析以及性能调优的各个方面,包括监控工具使用和实际案例分析。
236 3
|
5月前
|
消息中间件 分布式计算 监控
大数据-78 Kafka 集群模式 集群的应用场景与Kafka集群的搭建 三台云服务器
大数据-78 Kafka 集群模式 集群的应用场景与Kafka集群的搭建 三台云服务器
168 6
|
5月前
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
94 2
|
5月前
|
分布式计算 Java Hadoop
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(一)
Hadoop-09-HDFS集群 JavaClient 代码上手实战!详细附代码 安装依赖 上传下载文件 扫描列表 PUT GET 进度条显示(一)
67 2
|
5月前
|
存储 数据采集 分布式计算
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
87 1
|
5月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
276 6