WordCount 案例在集群上运行| 学习笔记

简介: 快速学习 WordCount 案例在集群上运行

开发者学堂课程【Hadoop 分布式计算框架 MapReduce:WordCount 案例在集群上运行】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/94/detail/1487


WordCount 案例在集群上运行

 

简介:

1、在集群上测试

2、测试结果

 

 

在集群上测试:

用 maven 打  jar 包,需要添加的打包插件依赖

注意:标记红.颜色的部分需要替换为自己工程主类

<build>

IKplugins>

<plugin>

<artifactId>maven-compiler-plugin</artifactId><version>2.3.2</version>

<configuration>

<sourCe>1.8</ source>w<target>1.8</target>v</configuration>

</plugin>

<plugin>

<artifactId>maven-assembly-plugin </artifactId><configuration>

<descriptorRefs>

<descriptorRef>jar-with

dependencies</ descriptorRef>

</ descriptorRefs>v<archive>

<manifest>

<mainclass>com.atguigu.mr.wordcountDriver</mainclass>

</ manifest>

</ archive>

</ configuration>w<executions>

<execution>

<id>make-assembly</id>v<phase>package</phase>u<goalS>

<goal>single</goal>e</goals>

</execution>w</executions>

</plugin>

</plugins>

</ build>

注意:如果工程上显示红叉。在项目上右键 ->maven->update project 即可。

(1)将程序打成 jar 包,然后拷贝到 Hadoop 集群中

步骤详情:右键->Run as->maven install。等待编译完成就会在项目的 target 文件夹中生成 jar 包。如果看不到。在项目上右键-》Refresh,即可看到。修改不带依赖的 jar 包名称为 wc.jar,并拷贝该 jar 包到 Hadoop 集群。

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class wordcountDriver {

public static void main(String[] args) throws IOException,ClassNotFoundException,Interrup

Configuration conf = new Configuration();

//1获取 Job 对象

Job job = Job.getInstance(conf);

/2设置 jar 存储位置

job.setJarByClass(wordcountDriver.class);

//3关联 Map 和 Reduce 类

job.setMapperClass(WordcountMapper.class);job.setReducerClass(WordcountReducer.class);

//4设置 Mappen 阶段输出数据的 key 和 value 类型

job.setMapoutputKeyClass(Text.class);

job.setMapOutputValueclass ( Intwritable.class);

测试结果:

图片13.png

图片14.png

图片15.png

图片16.png

相关文章
|
存储 缓存 资源调度
想了解流计算,你必须得看一眼,实现Flink on Yarn的三种部署方式,并运行wordcount
想了解流计算,你必须得看一眼,实现Flink on Yarn的三种部署方式,并运行wordcount
813 0
想了解流计算,你必须得看一眼,实现Flink on Yarn的三种部署方式,并运行wordcount
|
4月前
|
分布式计算 Hadoop Java
【集群模式】执行MapReduce程序-wordcount
【集群模式】执行MapReduce程序-wordcount
|
4月前
|
分布式计算 Java Hadoop
【本地模式】第一个Mapreduce程序-wordcount
【本地模式】第一个Mapreduce程序-wordcount
|
10月前
|
分布式计算 Hadoop Java
Hadoop学习笔记:运行wordcount对文件字符串进行统计案例
Hadoop学习笔记:运行wordcount对文件字符串进行统计案例
60 0
|
分布式计算 资源调度 Hadoop
Hadoop基础学习---5、MapReduce概述和WordCount实操(本地运行和集群运行)、Hadoop序列化
Hadoop基础学习---5、MapReduce概述和WordCount实操(本地运行和集群运行)、Hadoop序列化
|
分布式计算 资源调度 Hadoop
Hadoop的环境搭建以及配置(wordcount示例)(二)
Hadoop的环境搭建以及配置(wordcount示例)(二)
106 0
|
分布式计算 Hadoop Java
Hadoop的环境搭建以及配置(wordcount示例)(一)
Hadoop的环境搭建以及配置(wordcount示例)
184 0
|
分布式计算 Hadoop Java
动手写的第一个MapReduce程序--wordcount
动手写的第一个MapReduce程序--wordcount
|
分布式计算 Hadoop Java
hadoop第一个运行实例wordcount
hadoop第一个运行实例wordcount
133 0
|
SQL 存储 分布式计算
10.EMR-MR 节点 WordCount 案例演示|学习笔记
快速学习10.EMR-MR 节点 WordCount 案例演示
102 0
10.EMR-MR 节点 WordCount 案例演示|学习笔记

相关实验场景

更多