运维前线:一线运维专家的运维方法、技巧与实践1.8 运维自动化依赖的团队模型

简介:

1.8 运维自动化依赖的团队模型


下面将从能力模型、驱动模型和技能模型三个角度来阐述运维团队和个人的能力要求,最后给出一个参考的组织结构。

1.8.1 团队的能力模型

具体的团队能力模型示意图如图1-15所示。

 

图1-15 团队能力模型

对于我带过的应用运维团队,我都会从如上三个方面对组员提出运维能力要求。

1)业务运维。因为对这块能力的要求越来越低,因此其在我们的考核体系中所占的比重也越来越低。日常的变更、扩容、故障定位、运维规划对人的能力要求都非常低,这些工作都能模式化且平台化,从而减少了对人的倚重。

2)运维研发。我希望每一个应用运维人员都有运维研发的能力,但这在现实中是不可能的。对于应用运维团队和运维部门来说,运维研发的配备必不可少。在应用运维团队的内部,可以让有研发能力的人迅速承担面向业务运维平台的建设,或者参与到部门的运维系统建设中,可以抽出50%的时间参与研发。运维研发能力是能够让团队价值迅速达成的有效保证,没有研发能力的运维不能成为一个好运维。

3)技术研究。运维是一个技术团队,需要通过技术来体现价值,当找到好的技术时就要想着如何将技术应用到业务上,为用户带来价值,比如说提升用户体验,减少成本等。

这个时候就会产生一个问题,应用运维团队内的人也会运维研发,同时又有专职的运维研发团队,那么他们的职责分工如何解决,在工作上是否会存在重复建设?我的回答是这样的:

首先,可以把运维研发初期定位在公共服务平台的研发上,比如说DNS、LVS、配置管理、监控系统、CMDB、数据分析平台等。

其次,运维研发还需要制定相应的运维研发规范,代码规范、UI规范、测试规范等,让所有参与运维研发的人统一遵守,包括应用运维研发的组员。

最后来说一下应用运维小组内的研发能力该如何发挥的问题。其实在很多运维团队中,运维都是跟随业务的,一则可以让应用运维研发人员开发面向业务的运维系统,因为他们最了解该业务的需求,能够实现自己想要的;另外一种更好的操作方式,是让应用运维小组内的研发人员抽出50%的时间参与到以运维研发牵头成立的虚拟研发小组中。一则可以进一步提高应用运维的研发水平;另外还可以提高运维研发对业务运维的理解,同时还能提高带队作战的能力。

那么,运维研发和应用运维的比例应该设置成多少比较合适?我个人认为3:1比较合适,大家也可以自检一下,自己的运维团队到底设置了多少运维研发人员?另外想要检测运维研发配备是否足够,可以周期性地看看运维团队取得的进步,特别是效率和质量等维度。

一个高性能的运维团队一定是以应用运维和运维研发为核心构建的!

1.8.2 团队的驱动模型

具体的团队驱动模型如图1-16所示。

 

图1-16 团队驱动模型

团队的驱动力不同,带来结果的就会完全不同。为什么很多运维人员都说自己很辛苦?这时你可以思考一下到底是什么在引导着你进行运维工作?传统的维护,往往都集中在第一阶段和第二阶段,而进入到高阶运维体系之后,我们需要迅速切换到价值驱动和用户驱动的维度上来。有了用户驱动和价值驱动,对运维的效率和质量就都会有更高的要求,对于外部驱动我们必须走自动化和平台这条道路。建议大家在平时的工作中加入质量、效率、成本等一些KPI要求,不要只局限于自己所做的事情,而是要关注自己所做的事情对产品和用户的影响。

1.8.3 团队的技能模型

BAT(百度、阿里、腾讯)很早就实施了职业通道体系,在运维侧细分了多个能力通道,比如说网络运维、业务运维、运维研发、DBA等。对于运维人员的成长也有明确的要求和衡量体系,在此我就不详细介绍了。

1.8.4 参考的运维团队组织结构

我们不一定要按照这个结构明确设置运维小组,但是运维的职能差不多就是这样。我还有另外一个建议,最好将公共服务研发团队和运维团队放在一个组织结构下,这样将会有利于公共化服务的推广,而公共化服务对运维效率的影响是最大的,如图1-17所示。

 

图1-17 运维团队组织结构

至此,自动化平台的深度解码已经完成。本章从多个层面带领大家了解运维自动化,其实还是希望能给大家带来一点借鉴意义。大胆地往前走吧,一切都有可能,唯独那些实现不了的,都是我们人的问题,无它。

相关文章
|
17天前
|
运维 监控
构建高效运维体系:从理论到实践
在当今快速发展的信息化时代,高效的运维体系是保障企业信息系统稳定运行的关键。本文旨在探讨如何构建一个高效、可靠的运维体系,通过分析当前运维面临的挑战,提出相应的解决策略,并结合实际案例,展示这些策略的实施效果。文章首先介绍了高效运维的重要性,接着分析了运维过程中常见的问题,然后详细阐述了构建高效运维体系的策略和步骤,最后通过一个实际案例来验证这些策略的有效性。
|
17天前
|
机器学习/深度学习 数据采集 人工智能
智能运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的兴起背景、核心组件及其在现代IT运维中的应用。通过对比传统运维模式,阐述了AIOps如何利用机器学习、大数据分析等技术,实现故障预测、根因分析、自动化修复等功能,从而提升系统稳定性和运维效率。文章还深入分析了实施AIOps面临的挑战与解决方案,并展望了其未来发展趋势。 ####
|
25天前
|
人工智能 运维 监控
构建高效运维体系:理论与实践的深度融合####
本文旨在探讨高效IT运维体系的构建策略,通过理论框架与实际案例并重的方式,深入剖析了现代企业面临的运维挑战。文章开篇概述了当前运维领域的新趋势,包括自动化、智能化及DevOps文化的兴起,随后详细阐述了如何将这些先进理念融入日常运维管理中,形成一套既灵活又稳定的运维机制。特别地,文中强调了数据驱动决策的重要性,以及在快速迭代的技术环境中保持持续学习与适应的必要性。最终,通过对比分析几个典型企业的运维转型实例,提炼出可复制的成功模式,为读者提供具有实操性的指导建议。 ####
|
26天前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
51 4
|
27天前
|
机器学习/深度学习 人工智能 运维
智能运维:AIOps在大型系统运维中的实践与挑战
【10月更文挑战第28天】随着云计算、大数据和人工智能的发展,AIOps(人工智能运维)应运而生,旨在通过算法和机器学习提高运维效率和质量。本文探讨了AIOps在大型系统运维中的实践与挑战,包括数据质量、模型选择和团队协作等方面,并通过一个异常检测案例展示了其应用。尽管面临挑战,AIOps仍有望成为未来运维的重要方向。
55 5
|
24天前
|
运维 负载均衡 Ubuntu
自动化运维的利器:Ansible入门与实践
【10月更文挑战第31天】在当今快速发展的信息技术时代,高效的运维管理成为企业稳定运行的关键。本文将引导读者了解自动化运维工具Ansible的基础概念、安装步骤、基本使用,以及如何通过实际案例掌握其核心功能,从而提升工作效率和系统稳定性。
|
25天前
|
运维 资源调度 监控
提升运维效率的关键技术与实践
在当今快速发展的信息技术时代,运维工作面临着前所未有的挑战和机遇。本文旨在探讨如何通过采用先进的技术和实施最佳实践来提高IT运维的效率和效果。我们将深入分析自动化工具、监控策略、灾难恢复计划以及持续集成/持续部署(CI/CD)等关键领域,展示它们如何协同工作以优化运维流程。此外,文章还将提供一些实际案例研究,帮助读者更好地理解这些概念的应用。无论是对于初创公司还是大型企业,掌握这些技术都将是提升竞争力的关键。
|
2月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
59 4
|
2月前
|
存储 运维 监控
高效运维:从基础架构到自动化管理的全面指南
【10月更文挑战第11天】 本文将深入探讨如何通过优化基础架构和引入自动化管理来提升企业IT运维效率。我们将从服务器的选择与配置、存储解决方案的评估,到网络的设计与监控,逐一解析每个环节的关键技术点。同时,重点讨论自动化工具在现代运维中的应用,包括配置管理、持续集成与部署(CI/CD)、自动化测试及故障排除等方面。通过实际案例分析,展示这些技术如何协同工作,实现高效的运维管理。无论是IT初学者还是经验丰富的专业人员,都能从中获得有价值的见解和实操经验。
77 1
|
2月前
|
运维 监控 测试技术
构建高效运维体系:从监控到自动化的实践之路
【10月更文挑战第9天】 在当今信息技术飞速发展的时代,运维作为保障系统稳定性与效率的关键角色,正面临前所未有的挑战。本文将探讨如何通过构建一个高效的运维体系来应对这些挑战,包括监控系统的搭建、自动化工具的应用以及故障应急处理机制的制定。我们将结合具体案例,分析这些措施如何帮助提升系统的可靠性和运维团队的工作效率。
54 1