Azkaban--介绍、架构、部署模式 | 学习笔记

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 快速学习 Azkaban--介绍、架构、部署模式

开发者学堂课程【Azkaban 大数据调度系统课程精讲Azkaban--介绍、架构、部署模式 学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/721/detail/12873


Azkaban--介绍、架构、部署模式


内容介绍:

一、Azkaban 介绍

二、Azkaban 功能特点

三、Azkaban 原理架构

四、Azkaban 三种部署模式

五、小结


一、Azkaban 介绍

1、从名字上看 Azkaban 的前面并没有加上阿帕奇,说明 Azkaban 并不是阿帕奇的项目,但并不妨碍它成为一款大数据生态链中非常给力的工作流调度器软件。

2、Azkaban 是由 linkedin (领英)公司推出的一个批量工作流任务调度器,用于在一个工作流内以一个特定的顺序运行一组工作和流程。Azkaban 使用 job 配置文件建立任务之间的依赖关系,并提供一个易于使用的 web 用户界面维护和跟踪你的工作流。Azkaban 做工作流很简单,把它配置好之后,可以按照设定的顺序运行工作和流程,并且还可以配合调度周期性的去执行。


二、Azkaban 功能特点

1、提供功能清晰,它使用的是 job 配置文件,里面是 kv 介质堆的形式,不会太多,大概三五行就可以描绘出任务,甚至是模块之间的关系,再加上依赖,配置好之后就可以进行执行。简单易用的 Web UI 界面,可以告别黑窗口稀有命令行,用 web 用户界面维护和跟踪你的工作流。

2、提供 job 配置文件快速建立任务和任务之间的依赖关系。

3、提供模块化和可插拔的插件机制,原生支持 command、Java、 Hive、Pig、Hadoop,任何一款软件只要通过shell 执行都可以转换成 Azkaban 来执行。

4、基于 Java 开发,代码结构清晰,易于二次开发。如果当中某些模块不符合企业中实际需求,可以针对它进行二次开发,修改源码。


三、Azkaban 原理架构

image.png

Azkaban 有三个模块,AzkabanWebServerAzkabanExecutorServermysql 服务器。

1mysql 服务器:存储元数据,如项目名称、项目描述、项目权限、任务状态、SLA 规则等。内置 hr 服务器也可以。用户打开页面,通过页面代表服务器创建相关的工程以及项目信息,信息被保存在 mysql 服务器中,执行服务器再读取保存在 mysql 服务器的信息,按照时间计划执行相关的任务即可。

2AzkabanWebServer:web 服务器,对外提供 web 服务,使用户可以通过 web 页面管理。职责包括项目管理、权限授权、任务调度、监控 executor删除等不需要安装,内置服务器。

3AzkabanExecutorServer:负贵具体的工作流的提交、执行。执行服务器,进行任务调度时,进行脚本执行,提交mr 程序,提交 have 脚本。

三个共同配合构成了 Azkaban 的原理。在实际开发和使用 Azkaban 过程中很少设计到开发 web 服务器和 executor服务器,只要按照语法手册使用它即可。


四、Azkaban 三种部署模式

1solo server mode

单节点模式也称为单机模式,该模式中 webServer

executorServer 运行在同一个进程中,进程名是 AzkabanSingleServer不再使用 mysql,使用自带的 H2数据库。这种模式包含 Azkaban 的所有特性,但是在比较复杂的时候,会有性能的问题。一般用来学习和测试。初学时可以简单的使用单节点模式,配置一两个参数就可以使用了。一般初学者进行使用。

2two-server mode

该模式使用 MySQL 数据库,Web ServerExecutor Server 运行在不同的进程中。把两个服务拆开,每个都是一个进程。在这种模式下可以使用第三方的数据库进行保存共有调度的相关信息,相当于拆分,分布式。在企业中使用最多。

3multiple-executor mode

多执行服务器,相当于在第二个模式上再增加多个执行服务器,比如公司工作流调度的需求特别的繁忙,特别多,一个执行服务器满足不了,比如每小时设置100个调度项目,但是它每小时只能执行50个,这时就可以部署两个或者三个执行,该模式使用 MySQL数据库,Web Server Executor Server 运行在不同的机器中。且有多个 Executor Server使功能更加强大,该模式适用于大规模应用。功能比较强大是第三个模式。


五、小结

Azkaban

1、是由领英退出的一-款开源免费的工作流调度器软件

2、特点

1)功能强大可以调度几乎所有软件的执行( command )

2)配置简单 job 配置文件

3)提供了 web 页面使用

4java语言开发源码清晰可见,可以进行二次开发

3、架构

1web 服务器:对外提供 web 服务用户在页面上进行项目的相关管理

2executor 服务器:负责具体的工作流的调度提交。

3)数据库:用于保存工作流相关信息(比如: mysql )

4、部署模式

单节点模式: webexecutor 在同一个进程适用于测试体验

two-server:webexecutor 在不同的进程中,可以使用第三方数据库

mutil-executor-server:webexecutor 在不同的机器上,可以部署多个 executor 服务器

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
8天前
|
自然语言处理 JavaScript Java
《鸿蒙HarmonyOS应用开发从入门到精通(第2版)》学习笔记——HarmonyOS架构介绍
HarmonyOS采用分层架构设计,从下至上分为内核层、系统服务层、框架层和应用层。内核层支持多内核设计与硬件驱动;系统服务层提供核心能力和服务;框架层支持多语言开发;应用层包括系统及第三方应用,支持跨设备调度,确保一致的用户体验。
123 81
|
22天前
|
NoSQL 关系型数据库 MySQL
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
143 56
《docker高级篇(大厂进阶):4.Docker网络》包括:是什么、常用基本命令、能干嘛、网络模式、docker平台架构图解
|
3月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
206 6
|
3月前
|
缓存 监控 API
探索微服务架构中的API网关模式
【10月更文挑战第5天】随着微服务架构的兴起,企业纷纷采用这一模式构建复杂应用。在这种架构下,应用被拆分成若干小型、独立的服务,每个服务围绕特定业务功能构建并通过HTTP协议协作。随着服务数量增加,统一管理这些服务间的交互变得至关重要。API网关作为微服务架构的关键组件,承担起路由请求、聚合数据、处理认证与授权等功能。本文通过一个在线零售平台的具体案例,探讨API网关的优势及其实现细节,展示其在简化客户端集成、提升安全性和性能方面的关键作用。
86 2
|
3月前
|
分布式计算 资源调度 Hadoop
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
91 2
|
3月前
|
存储 缓存 监控
探索微服务架构中的API网关模式
【10月更文挑战第1天】探索微服务架构中的API网关模式
101 2
|
21天前
|
Serverless 决策智能 UED
构建全天候自动化智能导购助手:从部署者的视角审视Multi-Agent架构解决方案
在构建基于多代理系统(Multi-Agent System, MAS)的智能导购助手过程中,作为部署者,我体验到了从初步接触到深入理解再到实际应用的一系列步骤。整个部署过程得到了充分的引导和支持,文档详尽全面,使得部署顺利完成,未遇到明显的报错或异常情况。尽管初次尝试时对某些复杂配置环节需反复确认,但整体流程顺畅。
|
2月前
|
缓存 负载均衡 JavaScript
探索微服务架构下的API网关模式
【10月更文挑战第37天】在微服务架构的海洋中,API网关犹如一座灯塔,指引着服务的航向。它不仅是客户端请求的集散地,更是后端微服务的守门人。本文将深入探讨API网关的设计哲学、核心功能以及它在微服务生态中扮演的角色,同时通过实际代码示例,揭示如何实现一个高效、可靠的API网关。
|
2月前
|
监控 安全 持续交付
构建高效的微服务架构:从设计到部署
构建高效的微服务架构:从设计到部署
30 1
|
2月前
|
Docker 微服务 容器
使用Docker Compose实现微服务架构的快速部署
使用Docker Compose实现微服务架构的快速部署
86 1

热门文章

最新文章