集成 Oozie 服务&调度 Mapreduce 程序 | 学习笔记

简介: 快速学习 集成 Oozie 服务&调度 Mapreduce 程序

开发者学堂课程【Hue 大数据可视化终端课程集成 Oozie 服务&调度 Mapreduce 程序学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/719/detail/12855


集成 Oozie 服务&调度 Mapreduce 程序


内容介绍

一、利用 hue 调度 Mapreduce 程序

二、单独提交 Mapreduce 程序


一、利用 hue 调度 Mapreduce 程序

Mapreduce 程序执行时稍微复杂需要配置较多参数,相关输入或者输出的路径、kafkas 的类型等等,具体操作如下。

提交程序存在两种,一种是利用 hue 提交 Mapreduce 程序架包,二是利用 oozie 进行整合。

首先打开浏览器,点击 query 下方的 scheduler 点击 workfllow,创建新的工作流,命名 hue Mapreduce,描述改为itcast。选择节点信息,并选择 Mapreduce 图标,拖住下方。添加 Mapreduce 程序架包,架包路径在 HDFS 上,可将本地 Mapreduce 提交至此。

image.png

选择后不能提交,其中需要很多的参数,比如开启新版本的 API、指定输入或者输出的类、路径,通过 properties 进行添加。

打开配置软件在 hue 下存在 maperduce-oozie-workfollow,其中记录了手动配置 Mapreduce 的所有参数,将参数进行复制。

首先复制启动开启使用新的 API mapredmapper.New -apI 后面为 ture,    注意要心细,之后添加 reduce api 然后 true

image.png

继续指定 MR 当中输出 key 的类型,肯定是和业务相关,mapreduce  .job . output .key .calss 此时输出的均为单词所以为 text 类型。接下来,指定 MR 输出 value 的类型,复制 mapreduce  .job . output .value .calss,输出为单词的次数。接下来指定输入路径 mapreduce.input dir ,这时可以选择直接敲路径,输入/则会展示要填入的,如:/oozie/input。输出则需要添加一个新的路径即可,如;/ozzie/output/666

image.png

指定执行的 map class,使用官方提供的类进行直接复制,自己做的类需要将类换成自己写的全路径。

接下来指定 reduce 运行的 calss,复制。最后进行配置 map task 的个数,可以选择开启或者不开启。

此时可以点击观察是否出错,确认无误后,点击 save 保存,进行提交。即可完成定时调度任务的搭建,可以点击 jobs 观察过程,或者点击 workflows 具体查看调度的情况,如果出错,查看日志,日志是排错的唯一依据。进行刷新,发现工作流成功。

接下来,进行验证,根目录中存在 output6666,双击文件打开,观看结果,可观察执行成功。

image.png


二、单独提交 Mapreduce 程序

另外可单独提交 Mapreduce 程序,与工作流没有关系。不点击调度,点击 Editor 编辑 MR 程序,此方式相当于直接提供一个架包,与调度无关。

image.png

点击 Mapreduce 程序选择架包,参数同上,此时运行相当于通过 Hue 直接使用 Mapreduce 程序进行提交。综上为query Mapreduce 程序提交。参数要根据代码具体情况进行指定。

image.png

相关文章
|
1月前
|
人工智能 数据可视化 开发者
FlowiseAI:34K Star!集成多种模型和100+组件的 LLM 应用低代码开发平台,拖拽组件轻松构建程序
FlowiseAI 是一款开源的低代码工具,通过拖拽可视化组件,用户可以快速构建自定义的 LLM 应用程序,支持多模型集成和记忆功能。
112 14
FlowiseAI:34K Star!集成多种模型和100+组件的 LLM 应用低代码开发平台,拖拽组件轻松构建程序
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。
215 10
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
|
3月前
|
安全 测试技术 数据安全/隐私保护
原生鸿蒙应用市场开发者服务的技术解析:从集成到应用发布的完整体验
原生鸿蒙应用市场开发者服务的技术解析:从集成到应用发布的完整体验
|
4月前
|
开发框架 .NET API
Windows Forms应用程序中集成一个ASP.NET API服务
Windows Forms应用程序中集成一个ASP.NET API服务
123 9
|
4月前
|
安全 Java 测试技术
ToB项目身份认证AD集成(二):快速搞定window server 2003部署AD域服务并支持ssl
本文详细介绍了如何搭建本地AD域控测试环境,包括安装AD域服务、测试LDAP接口及配置LDAPS的过程。通过运行自签名证书生成脚本和手动部署证书,实现安全的SSL连接,适用于ToB项目的身份认证集成。文中还提供了相关系列文章链接,便于读者深入了解AD和LDAP的基础知识。
127 0
|
数据采集 分布式计算 搜索推荐
Hadoop学习---7、OutputFormat数据输出、MapReduce内核源码解析、Join应用、数据清洗、MapReduce开发总结(一)
Hadoop学习---7、OutputFormat数据输出、MapReduce内核源码解析、Join应用、数据清洗、MapReduce开发总结(一)
|
存储 分布式计算 Hadoop
Hadoop基础学习---6、MapReduce框架原理(一)
Hadoop基础学习---6、MapReduce框架原理(一)
|
存储 分布式计算 Hadoop
【Hadoop】一个例子带你了解MapReduce
【Hadoop】一个例子带你了解MapReduce
115 1
|
数据采集 缓存 分布式计算
Hadoop学习---7、OutputFormat数据输出、MapReduce内核源码解析、Join应用、数据清洗、MapReduce开发总结(二)
Hadoop学习---7、OutputFormat数据输出、MapReduce内核源码解析、Join应用、数据清洗、MapReduce开发总结(二)
|
分布式计算 Hadoop 数据处理
Hadoop基础学习---6、MapReduce框架原理(二)
Hadoop基础学习---6、MapReduce框架原理(二)

热门文章

最新文章

相关实验场景

更多