YARN的辅助机构角色

简介: YARN的辅助机构角色

YARN辅助角色

YARN的架构中除了核心角色,即:

ResourceManager:集群资源总管家

NodeManager:单机资源管家

辅助角色:ProxyServer保障WEB UI访问的安全性,JobHistoryServer,记录历史程序运行信息和日志

 

还可以搭配2个辅助角色使得YARN集群运行更加稳定

代理服务器(proxyserver):web Application Proxy web应用程序代理

历史服务器(JobHistoryServer):应用程序历史信息记录服务

 

web应用代理(Web Application Proxy

代理服务器,即web应用代理是YARN的一部分,默认情况下,它将作为资源管理器(RM)的一部分,但是可以配置在独立模式下运行,使用代理的原因是为了减少通过YARN进行基于网络的攻击的可能性

 

这是因为,YARN在运行时会提供一个WEB UI站点(同HDFSWEB UI站点一样)可供用户在浏览器中查看YARN的运行信息

image.png

对外提供WEB站点会有安全性问题,而代理服务器的功能就是最大限度保障对web ui的访问是安全的,比如:

警告用户正在访问一个不受信任的站点

剥离用户访问的Cookie

开启代理服务器,可以提高YARN在开放网络中的安全性(但是不是绝对安全只能是辅助提高一些)

 

代理服务器默认集成在了ResourceManager

也可以将其分离出来单独启动,如果要分离代理服务器

1,在yarn-site.xml中配置yarn.web-proxy.address参数即可

image.png

 

2.并通过命令启动他即可$HADOOP_YARN_HOME/sbin/yarn-daemon.sh start proxyserver

 

 

JobHistoryServer历史服务区

历史服务器的功能很简单:记录历史运行的程序的信息以及产生的日志并提供WEB UI站点供用户使用浏览器查看

 

JobHistoryServer历史服务器功能:
提供WEB UI站点,供用户在浏览器上查看程序日志

可以保留历史数据,随时查看历史运行程序信息

之后需要去配置文件里面进行配置

 

 

 

目录
相关文章
|
6月前
|
资源调度 分布式计算 Hadoop
YARN如何实现资源管理?
【6月更文挑战第19天】YARN如何实现资源管理?
77 13
|
7月前
|
资源调度 分布式计算 监控
YARN【工作机制】
YARN【工作机制】
|
分布式计算 资源调度 Hadoop
Spark on Yarn集群模式搭建及测试
Spark on Yarn集群模式搭建及测试
354 0
|
资源调度 调度 容器
Yarn 的工作原理、流程【重要】
Yarn 的工作原理、流程【重要】
162 0
|
数据可视化 API 调度
Ansible最佳实践之 AWX 高级作业工作流的创建和调度
写在前面 分享一些 AWX 高级作业工作流的创建和调度的笔记 博文内容涉及: 创建和启动工作流模板 Demo 工作流调度和通知的相关介绍 食用方式: 需要了解 Ansible 理解不足小伙伴帮忙指正
377 0
Ansible最佳实践之 AWX 高级作业工作流的创建和调度
|
SQL 资源调度 分布式计算
配置 YARN 并启动测试|学习笔记
快速学习配置 YARN 并启动测试
配置 YARN 并启动测试|学习笔记
|
资源调度 Kubernetes Java
扩展Yarn资源模型详解1
扩展Yarn资源模型详解1
168 0
|
资源调度 Shell API
Hadoop3.0扩展Yarn资源模型详解2:资源Profiles说明
Hadoop3.0扩展Yarn资源模型详解2:资源Profiles说明
149 0
|
资源调度 分布式计算 Spark
|
资源调度 分布式计算 Hadoop
YARN 工作机制|学习笔记
快速学习 YARN 工作机制
137 0
YARN 工作机制|学习笔记