多 Job 串联案例完成|学习笔记

简介: 快速学习 多 Job 串联案例完成

开发者学堂课程【Hadoop 企业优化及扩展案例:多 Job 串联案例完成】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/96/detail/1574


多 Job 串联案例完成


目录:

一.写 TwolndexMapper.

二.将 mapper 写入 reducer

三.驱动

 

1. 写 TwolndexMapper.

protected void map( LongWritable key, Text value, Mapper .Context context)throws I0Exception, InterruptedException {atguigu--a.txt

atguigu--b.txt

atguigu--c.txt
// 1获取一行
String line = value.toString();
//  2切割
String[] fields = line.split("--");
//  3封装
Text k = new Text();Text v = new Text();
// 3写出
context.write(key, value);


2. 将 mapper 写入 reducer

public class TwoIndexReducer extends Reducer

@0verrideprotected void reduce(Text key,Iterable values, Context context)

throws I0Exception, InterruptedException f

atguigu --a.txt 3

--b.txt 2

--c.txt 2atguigu c.txt-->2  b.txt-->2  a.txt-->3
// 1拼接字符串
StringBuffer sb = new StringBuffer();for (Text value : values) {  sb. append(value.toString().replace("\t","-->") +"\t");

v.set(sb.toString());
//  2写出
context.write(key, v);

}


3. 驱动

图片26.png

相关文章
|
4月前
|
Oracle Java 关系型数据库
Java10 Lambda 设计和实现问题之在双流 concat 的场景中,确保 s1 和 s2 流水线上的算子与 s3 流水线上的算子正确串联起来,如何实现
Java10 Lambda 设计和实现问题之在双流 concat 的场景中,确保 s1 和 s2 流水线上的算子与 s3 流水线上的算子正确串联起来,如何实现
|
7月前
|
传感器 JSON Java
流计算中的流式图处理是什么?请解释其作用和常用操作。
流计算中的流式图处理是什么?请解释其作用和常用操作。
64 0
|
分布式计算 大数据 调度
Spark 原理_运行过程_Job 和 Stage 的关系 | 学习笔记
快速学习 Spark 原理_运行过程_Job 和 Stage 的关系
164 0
Spark 原理_运行过程_Job 和 Stage 的关系 | 学习笔记
|
分布式计算 大数据 数据处理
Spark 原理_总体介绍_逻辑执行图 | 学习笔记
快速学习 Spark 原理_总体介绍_逻辑执行图
124 0
Spark 原理_总体介绍_逻辑执行图 | 学习笔记
|
数据采集 分布式计算 监控
网站流量日志分析--工作流调度--预处理调度--程序打包 job 编写 | 学习笔记
快速学习网站流量日志分析--工作流调度--预处理调度--程序打包 job 编写
网站流量日志分析--工作流调度--预处理调度--程序打包 job 编写 | 学习笔记
|
分布式计算 Hadoop 索引
hadoop之多job串联(倒排索引案例)(15)
hadoop之多job串联(倒排索引案例)(15)
hadoop之多job串联(倒排索引案例)(15)
|
缓存 监控 NoSQL
Quick-Task 动态脚本支持框架之结构设计篇
前面两篇博文,主要是整体介绍和如何使用;接下来开始进入正题,逐步剖析,这个项目是怎么一步一步搭建起来的;本篇博文则主要介绍基本骨架的设计,围绕项目的核心点,实现一个基础的原型系统
284 0
Quick-Task 动态脚本支持框架之结构设计篇
EMQ
|
SQL 传感器 JSON
eKuiper Newsletter 2022-07|v1.6.0:Flow 编排 + 更好用的 SQL,轻松表达业务逻辑
eKuiper本年度第二个大版本 v1.6.0正式发布,面向Flow编排的图规则API已开发完成,同时达成了多个SQL语法和函数的提升,期望覆盖更多样的使用场景,帮助用户进一步减少定制开发的需求和成本。
EMQ
312 0
eKuiper Newsletter 2022-07|v1.6.0:Flow 编排 + 更好用的 SQL,轻松表达业务逻辑
|
Java 程序员 网络安全
CoProcessFunction实战三部曲之三:定时器和侧输出
使用定时器和侧输出处理双流场景的异常情况
194 0
CoProcessFunction实战三部曲之三:定时器和侧输出
|
分布式计算 Hadoop 开发者
多 Job 串联案例第一个 Job |学习笔记
快速学习 多 Job 串联案例第一个 Job
126 0
多 Job 串联案例第一个 Job |学习笔记