带你读《云上自动化运维宝典》——一文读懂云上大规模资源管理的最佳实践(2)

简介: 带你读《云上自动化运维宝典》——一文读懂云上大规模资源管理的最佳实践(2)

更多精彩内容,欢迎观看:

带你读《云上自动化运维宝典》——一文读懂云上大规模资源管理的最佳实践(1):https://developer.aliyun.com/article/1405349


2. 企业管理视角与云上资源连接:设计、检索、规范

1) 企业管理视角与云上资源转换

 

首先学习企业管理视角和云上资源之间的连接和转换,如下图所示:

 

image.png

 

上图中左侧表示云产品视角,将云上的云产品视角通过标签、资源目录、资源组等快速地关联起来,使用不同颜色的图标表示不同的部门,这样就可以通过标签快速地将各类资源按照部门进行分类,这样就可以清晰地观察到财务部、业务部等部门分别使用的资源,如右侧所示。在这个过程中,之所以能够在标签的分类中快速且方便地将其转换,是因为它利用了标签在云上的特点(资源的标签键),一个资源只能有一个标签值,这样即可保证将所有资源归属到对应的部门,而不会存在资源跨部门混淆的情况,这样就可以非常简单地实现从产品视角到企业业务视角的转换,这就是所谓的大道至简。

2) 多账号企业管理视角与云上资源转换

从部门视角来说,企业上云过程中为了业务发展会在云上使用多个账号来管理每个部门,如何构建出多账号下的企业部门视角?可以通过资源目录了解多账号下企业管理视角与云上资源的转换。如下图所示:

 image.png


image.png

观察上图,可以发现在多账号下可以通过资源目录将企业的每个账号变成对应的成员,再对成员进行统一的资源管理与管控。这样就能够快速地构建出企业级的统一规范和管理视角,即实现由单账号下的企业视角到多账号下的企业视图转换的能力。

 

 

3) 如何关联企业管理视角与云上资源

沿着上面的视角转换逻辑,学习关联企业的管理和资源管理,如下图:

 

image.png

(1)管理的目的

 

首先,管理的目的在于帮助企业更好地经营,帮助运维人员获得其他角色人员可以更高效的进行资源使用、运维、自动化等能力。因此,关联管理与云上资源时的设计要具备面向业务、可理解的特点,同时希望关联的关系场景是通用的,具备可复用的能力,此外,对于后面的场景需要有一定的认识,即价值可衡量。

 

2)操作步骤

 

①定义分类(的名称):好的定义,如“应用”“部门”“项目”等,这些事对于应用使用场景较好的分类;而坏的分类,如将像CIM应用等具体的分类值作为分类的定义,如同时使用“owner”和“归属者”来定义归属的分类,这样就具备了相同的分类含义,而多个分类值会导致分类模糊。

 

②制定分类规范:如“责任人”需要用名字的全称或工号等表示,是对于定义分类规范的释义。

 

③定义应用的范围:即要分类的定义是在某个账号下进行管控?或是多账号进行管控?或是在某个项目、应用、部门下进行管控?该步要定义资源所作用的产品的范围、资源类型等。

 

④把对应的分类和应用的指标应用到业务,如管理场景视图、运维视图、财务视图等。

 

⑤根据业务需要设计更多的分类,持续地治理跟使用。

4) 如何快速检索资源

前面的内容中提到了可以通过分类的方式实现方便的查找,那如何进行快速的检索?

 

阿里云提供了多种多样的检索能力,可以通过云产品的API、资源管控的API、各个产品的资源管理的控制台进行检索,本节课介绍的是阿里云提供的高级搜索的全新功能。

 

1)资源中心高级搜索:此功能不同于传统搜索方式,它不再受限于基于固定的筛选条件,高级的搜索方式提供了灵活、强大的搜索功能,满足个性化的、复杂的查询诉求。该功能支持复杂场景的搜索,无论是关键资源,还是多种条件下的查询,抑或是统计分析等场景,都能借助SQL轻松应对。

 

如下图所示:

 

image.png

 

通过选中的属性自动生成查询条件,快速实现跨账号的查询,同时,对于日常的事例也进行了模板化的管理,可以直接选择模板进行修改,简化整体的编写过程,快速掌握查询的技巧,能够让用户在云上使用和检索资源时更方便、快速地找到所需的资源。

 

2)多元化的搜索结果呈现:对于查询结果,阿里云支持视图的呈现,如下图所示:

 

image.png

 

满足查询的结果要求以图表的形式呈现,可以更直观地了解资源的占比、分布、趋势,进而实现跨账号、跨资源类型、跨地域的快速查询。也可以通过搜索的API或对应的检索的API进行检索,如标签查询API,实现跨产品、跨资源类型的检索能力。

1) 如何保障规范管理

在可以进行快速资源检索之后,应如何保障资源在使用的生命周期中始终保持规范呢?

 

要保障资源在使用的生命周期中始终规范,就是要控制符合规范的流程,从资源的生命周期上来看,分别是创建、分配、使用、运维、回收,在整个周期中,会有部分节点会产生不规范的资源,如果可以在这些产生不规范资源的节点加以手段进行控制,即可保障资源始终规范。

 

image.png

 

(1)保障的方法

 

首先,显而易见的是资源的创建。在资源的运维上,如修改资源标签,增量的产生不规范的资源可以通过控制不规范资源生产失败的方式来拦截对于不规范资源的生产,即事前拦截能力。事前拦截能力利用对于标签策略的事前拦截功能,根据情况可以做到完全拦截、半完全拦截。

 

而如果业务不允许影响资源的创建,只能生产出来再做检测,又该如何处理?可以通过标签策略的检测功能以及自动修复能力可以做到分类标签的检测范围。若分类是部门,企业的部门可选值是业务部、市场部、研发部、财务部等,则出现这几种情况便符合规范,而假设部门不在情况之内则是不符合规范的,如IT部,其不在规范中,就不符合规范。这样,即实现对增量的防范和存量的治理,即可保障资源在使用的全生命周期都是符合规范的。

 

总之,就是通过标签策略的方式进行事前拦截、事后检测。

 

(2)保障的步骤

 

了解了保障资源规范的方法,接下来学习如何保障,即步骤。如下图:

 

image.png

 

 

 

首先,要保障你的资源管理,就要知道设计的分类所作用的场景及其规范和标准,例如,标签后续的场景考虑的是分账,则分组设计要考虑对归属者、团队、部门、产品、子公司,此时分组设计中就要进行标签键的确认,如业务标签设计为biz,标签值是databusiness等几个确定的、有限的有效值,产品的标签键设计为product,标签值是p name1等确定的标签值,还有一些其他一系列的标签。同时,对于标签值的规范还可以进行正则的匹配、校验设计。

 

在规范下如何进行应用?

 

如在设定标签键时,可以通过规范来进行设置,假设对业务的可选值设定为1个大写字符+6个数字来表示,则A123123符合规范,123123不符合规范。再次选择产品的范围,确定事后检测的范围。如只对ECS的所有资源进行检测,此时,在检测范围内勾选ECS实例。通过检测范围选定以后,再判断是否要进行事前的拦截,即判断“资源不带标签或者带标签但不符合规范是否可以进行生产”的方式来进行拦截,且如果不符合规范,是否进行自动修复。

 

通过以上步骤的配置就可以保障资源的规范管理。针对一种特殊的场景,如在资源管理过程当中,希望ECS云服务器对应绑定的EIP网卡带由实例的标签,即关联的资源能够快速继承标签,使得所有的资源在整个应用的过程中快速地满足诉求,也可以进行勾选,然后配置对应的分类键,只要EIP挂载的实例有标签,就会自动继承,进而实现对全链路云上资源的管理。这样就保障了资源分类和使用过程中的规范和标准,为后续的业务场景的使用做数据和技术的准备。


更多精彩内容,欢迎观看:

带你读《云上自动化运维宝典》——一文读懂云上大规模资源管理的最佳实践(3):https://developer.aliyun.com/article/1405347

相关文章
|
2月前
|
运维 Prometheus 监控
OceanBase 的运维与监控最佳实践
【8月更文第31天】随着分布式数据库解决方案的需求日益增长,OceanBase 作为一种高性能的分布式数据库系统,在众多场景下得到了广泛应用。为了确保 OceanBase 集群的稳定运行,合理的运维与监控是必不可少的。本文将探讨 OceanBase 的日常运维管理与监控策略,并提供相应的代码示例。
64 2
|
3月前
|
机器学习/深度学习 监控 算法
自动化测试框架的演进与最佳实践
随着软件行业的迅猛发展,自动化测试已成为确保软件质量的关键手段。本文将深入探讨自动化测试框架的历史演进、当前趋势以及面临的挑战,并结合实际案例分析,提出一系列的最佳实践策略,旨在帮助读者构建更加高效、稳定的自动化测试体系。
|
15天前
|
运维 云栖大会
运维管理新品发布与最佳实践 | 2024云栖大会预告
运维管理新品发布与最佳实践 | 2024云栖大会
|
2月前
|
存储 运维 监控
数据库服务器运维最佳实践
【8月更文挑战第22天】
46 2
数据库服务器运维最佳实践
|
2月前
|
持续交付 jenkins Devops
WPF与DevOps的完美邂逅:从Jenkins配置到自动化部署,全流程解析持续集成与持续交付的最佳实践
【8月更文挑战第31天】WPF与DevOps的结合开启了软件生命周期管理的新篇章。通过Jenkins等CI/CD工具,实现从代码提交到自动构建、测试及部署的全流程自动化。本文详细介绍了如何配置Jenkins来管理WPF项目的构建任务,确保每次代码提交都能触发自动化流程,提升开发效率和代码质量。这一方法不仅简化了开发流程,还加强了团队协作,是WPF开发者拥抱DevOps文化的理想指南。
49 1
|
2月前
|
缓存 运维 监控
打造稳定高效的数据引擎:数据库服务器运维最佳实践全解析
打造稳定高效的数据引擎:数据库服务器运维最佳实践全解析
|
2月前
|
C# 开发者 Windows
全面指南:WPF无障碍设计从入门到精通——让每一个用户都能无障碍地享受你的应用,从自动化属性到焦点导航的最佳实践
【8月更文挑战第31天】为了确保Windows Presentation Foundation (WPF) 应用程序对所有用户都具备无障碍性,开发者需关注无障碍设计原则。这不仅是法律要求,更是社会责任,旨在让技术更人性化,惠及包括视障、听障及行动受限等用户群体。
48 0
|
2月前
|
测试技术
软件测试的艺术与科学:探索自动化测试的最佳实践
【8月更文挑战第31天】在软件开发的海洋中,测试是确保航船稳健前行的罗盘。本文将带你揭开软件测试的神秘面纱,深入探讨自动化测试的魅力和挑战。我们将一起航行于代码的波浪之中,学习如何构建稳固的测试框架,以及如何利用这些框架来捕捉那些潜藏在深处的缺陷。加入我们,让我们一起提升软件质量,确保每一次航行都能抵达成功的彼岸。
|
3月前
|
运维 监控 安全
云上智能监控:引领未来安防与运维的新纪元
通过智能视频分析技术自动识别违章行为(如闯红灯、超速等)并触发报警机制。同时结合交通流量监测和信号灯控制功能实现交通流量的优化和拥堵缓解。 智能零售监控:在零售行业中云上智能监控可以应用于店铺的客流统计和商品管理。
|
3月前
|
人工智能 运维 自然语言处理
下一篇
无影云桌面