Azkaban是什么?(一)

简介:

Azkaban是什么?

   Azkaban是一套简单的任务调度服务,整体包括三部分webserver、dbserver、executorserver。

      是linkin的开源项目,开发语言为Java

  Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作和流程。

  Azkaban定义了一种KV文件格式来建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。

 

 

 

 

Azkaban典型使用场景

  实际当中经常有这些场景:每天有一个大任务,这个大任务可以分成A,B,C,D四个小任务,A,B任务之间没有依赖关系,C任务依赖A,B任务的结果,D任务依赖C任务的结果。一般的做法是,开两个终端同时执行A,B,两个都执行完了再执行C,最后再执行D。这样的话,整个的执行过程都需要人工参加,并且得盯着各任务的进度。但是我们的很多任务都是在深更半夜执行的,通过写脚本设置crontab执行。其实,整个过程类似于一个有向无环图(DAG)。每个子任务相当于大任务中的一个流,任务的起点可以从没有度的节点开始执行,任何没有通路的节点之间可以同时执行,比如上述的A,B。总结起来的话,我们需要的就是一个工作流的调度器,而azkaban就是能解决上述问题的一个调度器。

 

 

 

Azkaban官网

 https://azkaban.github.io/

 


本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6294321.html,如需转载请自行联系原作者

相关文章
|
7月前
|
SQL 分布式计算 Hadoop
Azkaban【基础 01】核心概念+特点+Web界面+架构+Job类型(一篇即可入门Azkaban工作流调度系统)
【2月更文挑战第6天】Azkaban【基础 01】核心概念+特点+Web界面+架构+Job类型(一篇即可入门Azkaban工作流调度系统)
554 0
|
开发框架 架构师 Devops
什么是质量工程?(上)
什么是质量工程?
307 0
|
7月前
|
分布式计算 资源调度 Hadoop
Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)
【4月更文挑战第4天】Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)
92 4
|
7月前
|
分布式计算 Hadoop 数据挖掘
Azkaban
Azkaban
70 0
|
人工智能 运维 安全
什么是质量工程?(下)
什么是质量工程?(下)
108 0
|
SQL 分布式计算 Java
【Azkaban】(一)Azkaban 入门
【Azkaban】(一)Azkaban 入门
221 0
【Azkaban】(一)Azkaban 入门
|
SQL 分布式计算 安全
【Oozie】(二)Oozie 架构及运行模型介绍
【Oozie】(二)Oozie 架构及运行模型介绍
507 0
【Oozie】(二)Oozie 架构及运行模型介绍
|
SQL 分布式计算 Java
Azkaban的基础介绍
Azkaban的基础介绍
|
缓存 关系型数据库 MySQL
Azkaban任务调度系统之安装实战
Centos7下,Azkaban的安装实战
|
分布式计算 关系型数据库 MySQL