YARN On Mapreduce搭建与wordCount案例实现

2023-05-23 96

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： YARN On Mapreduce搭建与wordCount案例实现

文章目录

1.3 启动服务和rm

2.运行官方的WC案例

2.1 运行jar

1.前言

YARN的基本思想是将资源管理RM，和作业调度、监控功能拆分成单独的守护进程。这个思想中拥有一个全局的资源管理器以及每个应用的MASTER,AM。每一个应用都是单个作业或者一个DAG作业。

架构图：

1.YARN 集群搭建

1.1 ResourceManager High Availability 架构图

1.2 配置文件

mapred-site.xml

cp mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

yarn-site.xml

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.resourcemanager.ha.enabled</name>

</property>

<name>yarn.resourcemanager.zk-address</name>

</property>

<name>yarn.resourcemanager.cluster-id</name>

<value>mashibing</value>

</property>

<属性>

<name>yarn.resourcemanager.ha.rm-ids</name>

<价值>RM1，RM2</价值>

</财产>

<属性>

<name>yarn.resourcemanager.hostname.rm1</name>

<值>节点03</值>

</财产>

<属性>

<name>yarn.resourcemanager.hostname.rm2</name>

<值>节点04</值>

</财产>

配置节点分发到其他节点。

1.3 启动服务和rm

启动yarn

start-yarn.sh

启动rm资源管理

yarn-daemon.sh 启动资源管理器

访问页面查看集群状态

http://node03:8088

http://node04:8088

2.运行官方的WC案例

/opt/bigdata/hadoop-2.6.5/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar

2.1 运行jar

准备一个data.txt文件

你好词

精英你好

你好词

哈多普纱线

蜂巢 HBase

蜂巢浩普

# 创建目录

HDFS DFS -MKDIR -p /data/wc/input

#上传文件

hdfs dfs -D dfs.blocksize=1048576 -put data.txt /data/wc/input

# 运行

Hadoop jar Hadoop-mapreduce-examples-2.6.5.jar wordcount /data/wc/input /data/wc/output

日志

hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount /data/wc/input /data/wc/output

23/04/23 06:50:41 INFO input.FileInputFormat: Total input paths to process : 1

23/04/23 06:50:41 INFO mapreduce.JobSubmitter: number of splits:1

23/04/23 06:50:41 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1682257192920_0002

23-04-23 06：50：41 信息YarnClientImpl：已提交申请application_1682257192920_0002

23/04/23 06：50：41 信息地图减少。作业：用于跟踪作业的网址：http://node03:8088/proxy/application_1682257192920_0002/

23/04/23 06：50：41 信息地图减少。作业：正在运行作业：job_1682257192920_0002

23/04/23 06：50：53 信息地图减少。作业：在优步模式下运行的作业job_1682257192920_0002：假

23-04-23 06：50：53 信息地图减少。作业：地图 0% 减少 0%

23-04-23 06：51：02 信息地图减少。作业：地图 100% 减少 0%

23-04-23 06：51：10 信息地图减少。作业：地图 100% 减少 100%

23/04/23 06：51：11 信息地图减少。作业：作业job_1682257192920_0002成功完成

23/04/23 06：51：11 信息地图减少。职位：计数器：49

查看输出

# 查看输出

[root@node01 mapreduce]# hdfs dfs -ls /data/wc/output

Found 2 items

-rw-r--r-- 2 根超组 0 2023-04-23 06：51 /data/wc/output/_SUCCESS

-rw-r--r-- 2 根超群 62 2023-04-23 06：51 /data/wc/output/part-r-00000

[root@node01 mapreduce]# hdfs dfs -cat /data/wc/output/part-r-00000

精英 1

哈多普 1

浩普 1

HBase1

你好 3

蜂巢 2

字 2

纱线 1

YARN On Mapreduce搭建与wordCount案例实现

文章目录

1.前言

1.YARN 集群搭建

1.1 ResourceManager High Availability 架构图

1.2 配置文件

mapred-site.xml

yarn-site.xml

1.3 启动服务和rm

启动yarn

启动rm资源管理

访问页面查看集群状态

2.运行官方的WC案例

2.1 运行jar

准备一个data.txt文件

日志

查看输出

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

YARN On Mapreduce搭建与wordCount案例实现

文章目录

1.前言

1.YARN 集群搭建

1.1 ResourceManager High Availability 架构图

1.2 配置文件

mapred-site.xml

yarn-site.xml

1.3 启动服务和rm

启动yarn

启动rm资源管理

访问页面查看集群状态

2.运行官方的WC案例

2.1 运行jar

准备一个data.txt文件

日志

查看输出

热门文章

最新文章

相关课程

相关电子书

相关实验场景