自动化运维的概念|学习笔记

简介: 快速学习自动化运维的概念

开发者学堂课程【批量云资源管理与自动化运维自动化运维的概念】学习笔记,与课程紧密联系,让用户快速学习知识。  

课程地址:https://developer.aliyun.com/learning/course/512/detail/6838


自动化运维的概念


内容介绍

一、什么是自动化运维

二、运维自动化的三个阶段

三、如何实现自动化运维

四、阿里云 ROS 相较传统自动化运维(工具、方式、手段)的优势


一、什么是自动化运维

上节课主要讲自动化运维和阿里云 ROS 产品的基本目录,课程主旨。

针对课程目录进行具体的分析讲解。

传统运维由6部分组成:环境定义、部署、监控、告警响应、性能优化、SLA 保障

自动化运维与传统运维的区别,自动化运维主要分为5部分,以环境定义自动化为中心,所有运维都在一个大环境上。技术环境、网络环境所有运维部分都围绕环境设定。

环境定义自动化的基础上可以实现部署自动化、监控自动化、响应自动化、优化自动化。

图片1.png

自动化运维的基本构成:根据传统运维流程演变而来,各项采用自动化处理模式。主要目的提高时效性,降低成本性。

自动化的价值在将运维从繁琐的、例行、容易发生人为事故的工作中 脱离出来,人操作在某种意义上一定比机器自动化操作发生事故率大得多,不管是脚本还是程序化都按照设定去实施、应用。如果脚本、设备没有问题一般情况下不会出现错误率,做更有价值的业务运维和服务运维就是自动化运维。


二、运维自动化的三个阶段

操作自动化

把运维一系列的手工执行的操作,用脚本或工具简单串起来,更加高效快速且故障率降低

场景自动化

工具会根据外部环境判断如何运行,比操作自动化上升一步是阶梯状的,操作自动化需要手动操作,场景自动化脚本、工具或应用会根据场景的变化而变化。判断条件是事先运维定义好的,需要人工设定,设定好后会按照设定的参数推下去。

智能化

具备数据核心,具备根据数据自己分析和判断、并自我决策和执行的能力。推广很普及的包括人工智能化、工具智能化、模块智能化是流行的趋势。


三、如何实现自动化运维

有三个阶段

1.先解决痛点

·日常工作中,对常见问题进行分类和梳理,能做成工具的就工具化,能程序化操作的,就避免人为干预,可以大大减少部署故障率、实施故障率。

2. 正确的阶段

·手动支撑,所有参数、部署环节目前都需要手动标定。

·线上标准规范化,做到某一步要有标准化,什么是对的,哪样做会回滚,怎样做是错的会终止。

·运维工具化,运维工具化已经普及。很多自动化运维软件,监控类的 Zabbix, 部署类的 Ansible 都是开源免费的。

·平台自动化,包括阿里云 ROS 是自动化的大平台

3.原子件 & 复合件

为了解决痛点而搭建的运维自助部署平台,平台基于标准化 /CMDB 部署的高大上运维自动化平台,可以共存。可以做自动化部署,同时可以分析一些痛点自动化分析。


四、阿里云 ROS 相较传统自动化运维(工具、方式、手段)的优势

运维出身的人提到自动化运维觉得工具设定很麻烦,部署不是一般有运维经验的人能部署完的,涉及到开发的东西。

很多运维同仁实施运维自动化时,想谋求设计一个完备的系统,来自动化完成几乎所有运维工作,又被复杂程度所困惑、踌躇不前。

在思考怎样做运维自动化之前,相信一句话:企业的架构不是设计出来的,是一步一步通过不断完善演变而来的,此需求才是最正确的需求。客户不断摸索出来的最终需求才是真的需求。非常高端的架构师设计出的平台、架构并不是公司所需要的,也许过剩、也许不够。

不管是架构还是任何设计都应该按照真正的需求而慢慢演变推算而来。

传统运维和 ROS 的优劣

传统自动化运维操作复杂,需要准备的工具和步骤繁琐

ROS 生在云上,更容易针对云资源进行部署、运维。

图片2.png

相关实践学习
使用ROS创建VPC和VSwitch
本场景主要介绍如何利用阿里云资源编排服务,定义资源编排模板,实现自动化创建阿里云专有网络和交换机。
ROS入门实践
本课程将基于基础设施即代码 IaC 的理念,介绍阿里云自动化编排服务ROS的概念、功能和使用方式,并通过实际应用场景介绍如何借助ROS实现云资源的自动化部署,使得云上资源部署和运维工作更为高效。
相关文章
|
11月前
|
机器学习/深度学习 人工智能 运维
构建高效运维体系:从自动化到智能化的演进
本文探讨了如何通过自动化和智能化手段,提升IT运维效率与质量。首先介绍了自动化在简化操作、减少错误中的作用;然后阐述了智能化技术如AI在预测故障、优化资源中的应用;最后讨论了如何构建一个既自动化又智能的运维体系,以实现高效、稳定和安全的IT环境。
212 4
|
2月前
|
机器人 API
使用OOS实现RAM权限审批流授权及自动化撤销授权的概念验证
本方案通过阿里云OOS与ROS联动,实现RAM账户授权自动化。用户申请后由审批人确认,系统自动授予指定策略,并在预设时间后自动撤销权限,提升安全性与管理效率。
|
2月前
|
运维 监控 安全
从实践到自动化:现代运维管理的转型与挑战
本文探讨了现代运维管理从传统人工模式向自动化转型的必要性与路径,分析了传统运维的痛点,如效率低、响应慢、依赖经验等问题,并介绍了自动化运维在提升效率、降低成本、增强系统稳定性与安全性方面的优势。结合技术工具与实践案例,文章展示了企业如何通过自动化实现运维升级,推动数字化转型,提升业务竞争力。
|
11月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
213 4
|
6月前
|
机器学习/深度学习 人工智能 运维
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
260 14
|
8月前
|
机器学习/深度学习 人工智能 运维
基于AI的自动化事件响应:智慧运维新时代
基于AI的自动化事件响应:智慧运维新时代
360 11
|
6月前
|
机器学习/深度学习 人工智能 运维
基于AI的自动化服务器管理:解锁运维的未来
基于AI的自动化服务器管理:解锁运维的未来
626 0
|
10月前
|
机器学习/深度学习 运维 监控
智能化运维:从自动化到AIOps的演进之路####
本文深入探讨了IT运维领域如何由传统手工操作逐步迈向高度自动化,并进一步向智能化运维(AIOps)转型的过程。不同于常规摘要仅概述内容要点,本摘要将直接引入一个核心观点:随着云计算、大数据及人工智能技术的飞速发展,智能化运维已成为提升企业IT系统稳定性与效率的关键驱动力。文章详细阐述了自动化工具的应用现状、面临的挑战以及AIOps如何通过预测性分析和智能决策支持,实现运维工作的质变,引领读者思考未来运维模式的发展趋势。 ####
|
10月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的崛起背景,深入分析了其核心概念、关键技术、应用场景及面临的挑战,并对比了传统IT运维模式,揭示了AIOps如何引领运维管理向更高效、智能的方向迈进。通过实际案例分析,展示了AIOps在不同行业中的应用成效,为读者提供了对未来智能运维趋势的洞察与思考。 ####
633 1
|
11月前
|
测试技术
自动化测试项目学习笔记(五):Pytest结合allure生成测试报告以及重构项目
本文介绍了如何使用Pytest和Allure生成自动化测试报告。通过安装allure-pytest和配置环境,可以生成包含用例描述、步骤、等级等详细信息的美观报告。文章还提供了代码示例和运行指南,以及重构项目时的注意事项。
887 1
自动化测试项目学习笔记(五):Pytest结合allure生成测试报告以及重构项目