【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)

简介: 【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)

相比于一种计算框架一个集群的模式,共享集群的模式具有以下三个优点

1:硬件共享 资源利用率高

2:人员共享  运维成本低

3:数据共享  数据复制开销低

一、集群资源统一管理系统

集群资源统一管理系统需要支持多种计算框架,并需要具有扩展性、容错 性和高资源利用率等几个特点

一个行之有效的资源统一管理系统需要包含资源管理、 分配和调度等功能

下图是统一管理与调度系统的基本架构图

商业服务器集群目前已经成为主要的计算平台,为互联网服务和大量的数据密集型 科学计算提供了强大的计算能力

当前多个计算框架公用一个服务器集群的方式是对集群进行静态划分,每个分区运行一个计算框架

另外一种方式是为每个计算框架分配一些虚拟机 VM,但是这些方法 都没有实现高利用率和数据共享

因此要设计一种集群资源管理系统支持多个计算框架,实现集群资源共享和高利用率,为了实现这一目标需要解决以下问题

支持多种不同的计算框架

集群资源管理系统需要支持良好的扩展性

需要具有良好的容错和高可靠性

二、Apache YARN

Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的Hadoop资源管理器,它是一个通用资源管理系统

YARN的基本思想是将的两个主要功能(资源管理和作业调度/监控) 分离,主要方法是创建一个全局的 ResourceManager(RM)和若干个针对应用程序的 ApplicationMaster(AM)

YARN分层结构的本质是ResourceManager,这个实体控制整个集群并管理应用程序像基础计算资源的分配

1:资源分配模型

Map Slot

Reduce Slot

这些slot无法在Map任务和Reduce任务之间共享

2:协议组件

Client-ResourceManager

ResourceManager– ApplicationMaster

ApplicationMaster-ContainerManager

三、Apache Mesos

Mesos 是以与Linux内核同样的原则创建的,不同点仅在于抽象的层面

Mesos 内核运行在每一个机器上,同时通过 API为各种应用提供跨数据中心和云的资源管理调度能力

Master使用Resource Offers实现跨应用细粒度资源共享,如 CPU 、内存 、磁盘 、网络等

架构图如下

下图是一个计算框架运行在Mesos上的资源供给流程 分为四步

1:Agent1像Master报告有四个CPU和4GB内存可用

2:Master发送一个Resource Offer给Framework1来描述Agent1有多少可用资源

3:Framework1中的FW Scheduler会答复Master有两个Task需要运行在Agent1上,一个Task需要多少内存和CPU

最后Master发送这些Task给Agent1,之后分配模块把剩下的CPU和内存分配给其他Framework

四、Google Omega

Mesos、YARN 等集群管理系统采用的是双层调度器,具有如下缺点

运行在这些集群管理系统上的计算框架无法知道整体集群的资源使用情况

并发粒度小,采用的是悲观方式的并发控制 (permissive concurrent control)

针对上述双层调度器 (two-level scheduler)的不足,Omega设计了共享状态调度器 (shared state scheduler)。该调度器将双层调度器中的集中式资源调度模块简化成了一些持久化的共享数据和针对这些数据的验证代码,而这里的共享数据实际上就是整个集群的实时资源使用信息

创作不易 觉得有帮助请点赞关注收藏~~~

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2天前
|
存储 安全 网络安全
云计算与网络安全:技术融合的未来
【6月更文挑战第12天】本文探讨了云计算和网络安全的交叉点,分析了云服务、网络安全和信息安全等技术领域的发展趋势。文章强调了在云环境下保护数据和系统的重要性,并讨论了如何通过技术和策略来实现这一目标。
14 4
|
23小时前
|
存储 安全 网络安全
云计算与网络安全:技术、挑战与未来
【6月更文挑战第14天】本文深入探讨了云计算与网络安全的交叉领域,包括云服务、网络安全和信息安全等技术领域。我们将分析云计算的基本概念、主要优势和潜在风险,同时探讨网络安全的关键技术和策略,以及信息安全的重要性。此外,我们还将讨论云计算与网络安全的未来趋势,以及如何在这个快速发展的领域中保持领先地位。
|
23小时前
|
存储 安全 网络安全
云计算与网络安全:技术融合与挑战
【6月更文挑战第14天】随着云计算技术的飞速发展,网络安全问题也日益凸显。本文将探讨云计算与网络安全之间的关系,包括云服务、网络安全、信息安全等技术领域。我们将分析云计算带来的安全挑战,并提出相应的解决方案。通过技术融合,我们可以实现更安全、高效的云计算环境。
8 3
|
1天前
|
机器学习/深度学习 安全 网络安全
云计算与网络安全:技术、挑战与未来
【6月更文挑战第13天】本文探讨了云计算与网络安全的关系,包括云服务、网络安全和信息安全等技术领域。文章首先介绍了云计算的基本概念和优势,然后分析了云计算面临的安全挑战,最后讨论了云计算与网络安全的未来发展趋势。
|
2天前
|
存储 安全 网络安全
云计算与网络安全:技术融合的双刃剑
【6月更文挑战第12天】本文深入探讨了云计算和网络安全之间的紧密关系。随着云服务的普及,网络安全问题日益凸显。文章首先介绍了云服务的基本概念和类型,然后详细讨论了网络安全的重要性以及面临的挑战。接着,文章分析了信息安全在云计算中的关键作用,并提出了相应的防护措施。最后,文章总结了云计算与网络安全的相互影响,强调了技术创新在提升网络安全水平方面的重要作用。
|
3天前
|
存储 安全 网络安全
云计算与网络安全:技术融合与未来发展
云计算与网络安全作为当今信息技术领域的热门话题,不仅在商业应用中发挥着重要作用,也对个人隐私和数据安全产生深远影响。本文将从云服务、网络安全和信息安全等多个技术领域出发,探讨其融合发展的趋势,并对未来发展方向进行展望。
7 2
|
3天前
|
存储 安全 网络安全
云计算与网络安全:技术融合与挑战
【6月更文挑战第11天】随着云计算技术的飞速发展,网络安全问题日益凸显。本文将探讨云计算与网络安全之间的关系,分析云服务、网络安全和信息安全等技术领域的发展趋势,以及如何应对这些挑战。
|
4天前
|
存储 安全 网络安全
云计算与网络安全:技术融合与挑战
【6月更文挑战第10天】本文探讨了云计算与网络安全的紧密联系,分析了云服务、网络安全和信息安全等技术领域的发展及其面临的挑战。通过阐述云计算的基本原理、网络安全的重要性以及信息安全的关键要素,强调了在云计算环境下保障网络安全和信息安全的必要性。
|
4天前
|
安全 网络安全 云计算
云计算与网络安全:技术融合的未来
【6月更文挑战第10天】随着云计算技术的飞速发展,网络安全问题也日益凸显。本文将探讨云计算与网络安全之间的关系,以及如何通过技术手段保障云服务的安全。我们将重点关注云服务、网络安全和信息安全等技术领域的最新进展,以期为读者提供一份全面的技术指南。
11 3
|
5天前
|
存储 安全 网络安全
云计算与网络安全:技术融合的双刃剑
【6月更文挑战第9天】在数字化时代,云计算作为一项革命性技术,正以前所未有的速度改变着我们的工作和生活方式。然而,随着云服务的普及和依赖程度的增加,网络安全问题也日益凸显。本文将探讨云计算与网络安全之间的关系,分析云服务、网络安全和信息安全等领域的技术挑战,并提出相应的解决方案。
9 0