YARN的基础配置

简介: 基于HADOOP3.0+Centos7.0的yarn基础配置; 执行步骤:(1)配置集群yarn (2)启动、测试集群(3)在yarn上执行wordcount案例 一、配置yarn集群   1.配置yarn-env.
基于HADOOP3.0+Centos7.0的yarn基础配置;
执行步骤:(1)配置集群yarn (2)启动、测试集群(3)在yarn上执行wordcount案例

一、配置yarn集群  

1.配置yarn-env.sh 

添加:export JAVA_HOME=/opt/module/jdk1.8.0_144 

  2.配置yarn-site.xml

 1 <!-- reducer获取数据的方式-->
 2 <property>
 3 <name>yarn.nodemanager.aux-services</name>
 4 <value>mapreduce_shuffle</value>
 5 </property>
 6 
 7 <!-- 指定YARN的ResourceManager的地址-->
 8 <property>
 9 <name>yarn.resourcemanager.hostname</name>
10 <value>hadoop101</value>
11 </property>
12 
13 <!--在etc/hadoop/yarn-site.xml文件中,修改检查虚拟内存的属性为false-->
14 <property>
15       <name>yarn.nodemanager.vmem-check-enabled</name>
16      <value>false</value>
17      </property>
18 
19      <!--引入hadoop路径-->
20     <property>
21     <name>yarn.application.classpath</name>
22 
23     <value>
24         /opt/hadoop-2.6.0/etc/hadoop,
25         /opt/hadoop-2.6.0/share/hadoop/common/*,
26         /opt/hadoop-2.6.0/share/hadoop/common/lib/*,
27         /opt/hadoop-2.6.0/share/hadoop/hdfs/*,
28         /opt/hadoop-2.6.0/share/hadoop/hdfs/lib/*,
29         /opt/hadoop-2.6.0/share/hadoop/mapreduce/*,
30         /opt/hadoop-2.6.0/share/hadoop/mapreduce/lib/*,
31         /opt/hadoop-2.6.0/share/hadoop/yarn/*,
32         /opt/hadoop-2.6.0/share/hadoop/yarn/lib/*
33     </value>
34      </property>

 

 3.配置:mapred-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_144 

  4.配置mapred-site.xml

<!-- 指定mr运行在yarn上-->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property> 
<property>
  <name>yarn.application.classpath</name>
       <value>
           /opt/hadoop-2.6.0/etc/hadoop,
            /opt/hadoop-2.6.0/share/hadoop/common/*,
            /opt/hadoop-2.6.0/share/hadoop/common/lib/*,
            /opt/hadoop-2.6.0/share/hadoop/hdfs/*,
            /opt/hadoop-2.6.0/share/hadoop/hdfs/lib/*,
           /opt/hadoop-2.6.0/share/hadoop/mapreduce/*,
           /opt/hadoop-2.6.0/share/hadoop/mapreduce/lib/*,
            /opt/hadoop-2.6.0/share/hadoop/yarn/*,
            /opt/hadoop-2.6.0/share/hadoop/yarn/lib/*
        </value>
 </property>

 

二、启动集群

1.启动hdfs集群(namenode+datanode) 

  2.启动yarn集群(resourceManger+nodeManager)

sbin/start-yarn.sh   or pasting

yarn --daemon start resourcemanager
yarn --daemon start nodemanager
3.jps+回车 查看进程

访问 http://192.168.1.101:8088/cluster 

三、运行案例 

1.删除文件系统上原来的output文件

hdfs dfs -rm -R /user/atguigu/output

2.执行mapreduce程序

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/atguigu/input /user/atguigu/output

3.查看运行结果

hdfs dfs -cat /user/atguigu/output/* 

 

 

 

历史服务器配置

配置mapred-site.xml

<property>
<name>mapreduce.jobhistory.address</name>
<value>0.0.0.0:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>0.0.0.0:19888</value>
</property>

启动命令:

mapred --daemon stop historyserver
or sbin/mr-jobhistory-daemon.sh start historyserver
访问地址: http://ip:19888/jobhistory

 

相关文章
|
19天前
|
消息中间件 资源调度 关系型数据库
如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理
本文介绍了如何在Flink on YARN环境中配置Debezium CDC 3.0,以实现实时捕获数据库变更事件并将其传输到Flink进行处理。主要内容包括安装Debezium、配置Kafka Connect、创建Flink任务以及启动任务的具体步骤,为构建实时数据管道提供了详细指导。
46 9
|
1月前
|
资源调度
Ubuntu22.04静态ip配置+yarn build后显示内存超限,变异失败
Ubuntu22.04静态ip配置+yarn build后显示内存超限,变异失败
40 2
Ubuntu22.04静态ip配置+yarn build后显示内存超限,变异失败
|
1月前
|
XML 分布式计算 资源调度
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(一)
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(一)
157 5
|
1月前
|
XML 资源调度 网络协议
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(二)
大数据-02-Hadoop集群 XML配置 超详细 core-site.xml hdfs-site.xml 3节点云服务器 2C4G HDFS Yarn MapRedece(二)
104 4
|
1月前
|
分布式计算 资源调度 Hadoop
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
79 4
|
3月前
|
资源调度 关系型数据库 MySQL
【Flink on YARN + CDC 3.0】神操作!看完这篇教程,你也能成为数据流处理高手!从零开始,一步步教会你在Flink on YARN模式下如何配置Debezium CDC 3.0,让你的数据库变更数据瞬间飞起来!
【8月更文挑战第15天】随着Apache Flink的普及,企业广泛采用Flink on YARN部署流处理应用,高效利用集群资源。变更数据捕获(CDC)工具在现代数据栈中至关重要,能实时捕捉数据库变化并转发给下游系统处理。本文以Flink on YARN为例,介绍如何在Debezium CDC 3.0中配置MySQL连接器,实现数据流处理。首先确保YARN上已部署Flink集群,接着安装Debezium MySQL连接器并配置Kafka Connect。最后,创建Flink任务消费变更事件并提交任务到Flink集群。通过这些步骤,可以构建出从数据库变更到实时处理的无缝数据管道。
312 2
|
4月前
|
缓存 资源调度 JavaScript
秒懂Yarn:从安装到配置的全流程详解
**Yarn**是Facebook推出的JavaScript包管理器,旨在提供更快、更安全的依赖管理。它通过并行安装、离线模式、版本锁定和友好的命令行界面提升效率。要安装Yarn,可以使用npm、Homebrew或Chocolatey。基本命令包括初始化项目(`yarn init`)、安装/移除/升级依赖(`yarn add/remove/upgrade`)。配置Yarn涉及设置`.yarnrc`文件,如更改registry。通过`yarn.lock`文件保证依赖一致性。文章还提供了使用Yarn进行API测试和项目管理的实战案例。
246 0
|
6月前
|
SQL 分布式计算 资源调度
Hadoop Yarn 配置多队列的容量调度器
配置Hadoop多队列容量调度器,编辑`capacity-scheduler.xml`,新增`hive`队列,`default`队列占总内存40%,最大60%;`hive`队列占60%,最大80%。配置包括队列容量、用户权限和应用生存时间等,配置后使用`yarn rmadmin -refreshQueues`刷新队列,无需重启集群。多队列配置可在Yarn WEB界面查看。
97 4
|
5月前
|
资源调度 JavaScript iOS开发
yarn的安装与配置(Windows/macOS)
yarn的安装与配置(Windows/macOS)
603 0
|
6月前
|
资源调度 前端开发 JavaScript
nvm,npm,yarn相关指令,前端配置准备
nvm,npm,yarn相关指令,前端配置准备
58 1
下一篇
无影云桌面