带你读《云上自动化运维宝典》——一文读懂云上大规模资源管理的最佳实践(2)

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
轻量应用服务器 4vCPU 16GiB,适用于搭建游戏自建服
简介: 带你读《云上自动化运维宝典》——一文读懂云上大规模资源管理的最佳实践(2)

更多精彩内容,欢迎观看:

带你读《云上自动化运维宝典》——一文读懂云上大规模资源管理的最佳实践(1):https://developer.aliyun.com/article/1405349


2. 企业管理视角与云上资源连接:设计、检索、规范

1) 企业管理视角与云上资源转换

 

首先学习企业管理视角和云上资源之间的连接和转换,如下图所示:

 

image.png

 

上图中左侧表示云产品视角,将云上的云产品视角通过标签、资源目录、资源组等快速地关联起来,使用不同颜色的图标表示不同的部门,这样就可以通过标签快速地将各类资源按照部门进行分类,这样就可以清晰地观察到财务部、业务部等部门分别使用的资源,如右侧所示。在这个过程中,之所以能够在标签的分类中快速且方便地将其转换,是因为它利用了标签在云上的特点(资源的标签键),一个资源只能有一个标签值,这样即可保证将所有资源归属到对应的部门,而不会存在资源跨部门混淆的情况,这样就可以非常简单地实现从产品视角到企业业务视角的转换,这就是所谓的大道至简。

2) 多账号企业管理视角与云上资源转换

从部门视角来说,企业上云过程中为了业务发展会在云上使用多个账号来管理每个部门,如何构建出多账号下的企业部门视角?可以通过资源目录了解多账号下企业管理视角与云上资源的转换。如下图所示:

 image.png


image.png

观察上图,可以发现在多账号下可以通过资源目录将企业的每个账号变成对应的成员,再对成员进行统一的资源管理与管控。这样就能够快速地构建出企业级的统一规范和管理视角,即实现由单账号下的企业视角到多账号下的企业视图转换的能力。

 

 

3) 如何关联企业管理视角与云上资源

沿着上面的视角转换逻辑,学习关联企业的管理和资源管理,如下图:

 

image.png

(1)管理的目的

 

首先,管理的目的在于帮助企业更好地经营,帮助运维人员获得其他角色人员可以更高效的进行资源使用、运维、自动化等能力。因此,关联管理与云上资源时的设计要具备面向业务、可理解的特点,同时希望关联的关系场景是通用的,具备可复用的能力,此外,对于后面的场景需要有一定的认识,即价值可衡量。

 

2)操作步骤

 

①定义分类(的名称):好的定义,如“应用”“部门”“项目”等,这些事对于应用使用场景较好的分类;而坏的分类,如将像CIM应用等具体的分类值作为分类的定义,如同时使用“owner”和“归属者”来定义归属的分类,这样就具备了相同的分类含义,而多个分类值会导致分类模糊。

 

②制定分类规范:如“责任人”需要用名字的全称或工号等表示,是对于定义分类规范的释义。

 

③定义应用的范围:即要分类的定义是在某个账号下进行管控?或是多账号进行管控?或是在某个项目、应用、部门下进行管控?该步要定义资源所作用的产品的范围、资源类型等。

 

④把对应的分类和应用的指标应用到业务,如管理场景视图、运维视图、财务视图等。

 

⑤根据业务需要设计更多的分类,持续地治理跟使用。

4) 如何快速检索资源

前面的内容中提到了可以通过分类的方式实现方便的查找,那如何进行快速的检索?

 

阿里云提供了多种多样的检索能力,可以通过云产品的API、资源管控的API、各个产品的资源管理的控制台进行检索,本节课介绍的是阿里云提供的高级搜索的全新功能。

 

1)资源中心高级搜索:此功能不同于传统搜索方式,它不再受限于基于固定的筛选条件,高级的搜索方式提供了灵活、强大的搜索功能,满足个性化的、复杂的查询诉求。该功能支持复杂场景的搜索,无论是关键资源,还是多种条件下的查询,抑或是统计分析等场景,都能借助SQL轻松应对。

 

如下图所示:

 

image.png

 

通过选中的属性自动生成查询条件,快速实现跨账号的查询,同时,对于日常的事例也进行了模板化的管理,可以直接选择模板进行修改,简化整体的编写过程,快速掌握查询的技巧,能够让用户在云上使用和检索资源时更方便、快速地找到所需的资源。

 

2)多元化的搜索结果呈现:对于查询结果,阿里云支持视图的呈现,如下图所示:

 

image.png

 

满足查询的结果要求以图表的形式呈现,可以更直观地了解资源的占比、分布、趋势,进而实现跨账号、跨资源类型、跨地域的快速查询。也可以通过搜索的API或对应的检索的API进行检索,如标签查询API,实现跨产品、跨资源类型的检索能力。

1) 如何保障规范管理

在可以进行快速资源检索之后,应如何保障资源在使用的生命周期中始终保持规范呢?

 

要保障资源在使用的生命周期中始终规范,就是要控制符合规范的流程,从资源的生命周期上来看,分别是创建、分配、使用、运维、回收,在整个周期中,会有部分节点会产生不规范的资源,如果可以在这些产生不规范资源的节点加以手段进行控制,即可保障资源始终规范。

 

image.png

 

(1)保障的方法

 

首先,显而易见的是资源的创建。在资源的运维上,如修改资源标签,增量的产生不规范的资源可以通过控制不规范资源生产失败的方式来拦截对于不规范资源的生产,即事前拦截能力。事前拦截能力利用对于标签策略的事前拦截功能,根据情况可以做到完全拦截、半完全拦截。

 

而如果业务不允许影响资源的创建,只能生产出来再做检测,又该如何处理?可以通过标签策略的检测功能以及自动修复能力可以做到分类标签的检测范围。若分类是部门,企业的部门可选值是业务部、市场部、研发部、财务部等,则出现这几种情况便符合规范,而假设部门不在情况之内则是不符合规范的,如IT部,其不在规范中,就不符合规范。这样,即实现对增量的防范和存量的治理,即可保障资源在使用的全生命周期都是符合规范的。

 

总之,就是通过标签策略的方式进行事前拦截、事后检测。

 

(2)保障的步骤

 

了解了保障资源规范的方法,接下来学习如何保障,即步骤。如下图:

 

image.png

 

 

 

首先,要保障你的资源管理,就要知道设计的分类所作用的场景及其规范和标准,例如,标签后续的场景考虑的是分账,则分组设计要考虑对归属者、团队、部门、产品、子公司,此时分组设计中就要进行标签键的确认,如业务标签设计为biz,标签值是databusiness等几个确定的、有限的有效值,产品的标签键设计为product,标签值是p name1等确定的标签值,还有一些其他一系列的标签。同时,对于标签值的规范还可以进行正则的匹配、校验设计。

 

在规范下如何进行应用?

 

如在设定标签键时,可以通过规范来进行设置,假设对业务的可选值设定为1个大写字符+6个数字来表示,则A123123符合规范,123123不符合规范。再次选择产品的范围,确定事后检测的范围。如只对ECS的所有资源进行检测,此时,在检测范围内勾选ECS实例。通过检测范围选定以后,再判断是否要进行事前的拦截,即判断“资源不带标签或者带标签但不符合规范是否可以进行生产”的方式来进行拦截,且如果不符合规范,是否进行自动修复。

 

通过以上步骤的配置就可以保障资源的规范管理。针对一种特殊的场景,如在资源管理过程当中,希望ECS云服务器对应绑定的EIP网卡带由实例的标签,即关联的资源能够快速继承标签,使得所有的资源在整个应用的过程中快速地满足诉求,也可以进行勾选,然后配置对应的分类键,只要EIP挂载的实例有标签,就会自动继承,进而实现对全链路云上资源的管理。这样就保障了资源分类和使用过程中的规范和标准,为后续的业务场景的使用做数据和技术的准备。


更多精彩内容,欢迎观看:

带你读《云上自动化运维宝典》——一文读懂云上大规模资源管理的最佳实践(3):https://developer.aliyun.com/article/1405347

相关文章
|
2月前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
354 23
|
2月前
|
弹性计算 运维 安全
云上DevOps自动化的最佳实践
本文介绍了云上DevOps自动化最佳实践,重点探讨了企业在上云过程中面临的成本管理、运维效率和弹性等问题。通过阿里云的产品和服务,企业可以实现自动化的资源管理、成本优化和高效运维。文章详细阐述了如何利用标签进行成本分析、选择合适的付费类型和实例规格、以及通过弹性伸缩降低成本。此外,还介绍了新功能发布,如统一的实例运维通道界面、AI辅助的运维工具等,帮助企业提升云上业务的管理和运营效率。
|
3月前
|
监控 数据管理 测试技术
API接口自动化测试深度解析与最佳实践指南
本文详细介绍了API接口自动化测试的重要性、核心概念及实施步骤,强调了从明确测试目标、选择合适工具、编写高质量测试用例到构建稳定测试环境、执行自动化测试、分析测试结果、回归测试及集成CI/CD流程的全过程,旨在为开发者提供一套全面的技术指南,确保API的高质量与稳定性。
|
3月前
|
数据管理 测试技术 持续交付
软件测试中的自动化测试策略与最佳实践
在当今快速迭代的软件开发环境中,自动化测试已成为确保软件质量和加速产品上市的关键手段。本文旨在探讨软件测试中的自动化测试策略,包括选择合适的自动化测试工具、构建有效的自动化测试框架以及实施持续集成和持续部署(CI/CD)。通过分析自动化测试的最佳实践,本文为软件开发团队提供了一系列实用的指南,以优化测试流程、提高测试效率并减少人为错误。
104 4
|
3月前
|
机器学习/深度学习 人工智能 监控
软件测试中的自动化测试策略与最佳实践##
在当今快速发展的软件行业中,自动化测试已成为确保软件质量和加速产品上市的关键工具。本文将探讨自动化测试的重要性,分析不同类型的自动化测试工具和框架,并深入讨论实施自动化测试的最佳实践。通过案例研究和数据分析,我们将揭示如何有效整合自动化测试到软件开发生命周期中,以及它如何帮助团队提高测试效率和覆盖率。 ##
95 1
|
4月前
|
Devops 测试技术 持续交付
软件测试中的自动化与持续集成:最佳实践与挑战
在快速迭代的软件开发周期中,自动化测试和持续集成(CI)已成为提高软件质量和加速产品上市的关键策略。本文探讨了自动化测试和CI的实施如何帮助开发团队提前发现缺陷、缩短反馈循环,并确保代码质量。我们将深入分析自动化测试的策略选择、工具应用以及面临的挑战,同时提供一些克服这些挑战的最佳实践。
126 15
|
4月前
|
监控 测试技术 持续交付
探索自动化测试在软件开发中的最佳实践
本文旨在深入探讨自动化测试在软件开发过程中的应用,以及如何有效地实施自动化测试以提高软件质量和开发效率。通过分析自动化测试的优势、挑战和最佳实践,本文为软件开发团队提供了一套实用的指导方案。
|
4月前
|
敏捷开发 测试技术 持续交付
软件测试中的自动化测试策略与最佳实践
【10月更文挑战第21天】 在当今快速迭代的软件开发周期中,自动化测试已成为确保软件质量和加速产品上市的关键工具。本文将深入探讨自动化测试的核心概念、策略选择以及实施过程中的最佳实践。我们将分析不同类型的自动化测试框架,并讨论如何根据项目需求选择合适的工具和技术。此外,我们还将分享一些成功案例和常见的陷阱,帮助读者避免在自动化测试旅程中遇到的潜在问题。通过本文的阅读,您将能够更好地理解自动化测试的价值,并为您的组织制定有效的测试策略。
72 0
|
4月前
|
设计模式 前端开发 JavaScript
自动化测试框架设计原则与最佳实践####
本文深入探讨了构建高效、可维护的自动化测试框架的核心原则与策略,旨在为软件测试工程师提供一套系统性的方法指南。通过分析常见误区,结合行业案例,阐述了如何根据项目特性定制自动化策略,优化测试流程,提升测试覆盖率与执行效率。 ####
109 6
|
4月前
|
测试技术 持续交付
软件测试中的自动化测试策略与最佳实践
【10月更文挑战第31天】 在当今快速迭代的软件开发环境中,自动化测试成为确保软件质量和加速产品上市的关键。本文探讨了自动化测试的重要性、实施策略以及一些最佳实践。通过分析不同类型的自动化测试工具和框架,本文旨在为软件开发团队提供一套实用的指导方案,以提高测试效率和质量。