运维工程师日常工作解析及 Ansible 全面介绍| 学习笔记

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 快速学习运维工程师日常工作解析及 Ansible 全面介绍

开发者学堂课程【自动化运维工具 Ansible 实战运维工程师日常工作解析及 Ansible 全面介绍】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/577/detail/7973


运维工程师日常工作解析及 Ansible 全面介绍


内容介绍

一、运维软件 Ansible

二、运维自动化发展历程及技术应用

三、云计算运维工程师核心职能

四、运维工程师职能划分

五、自动化运维应用场景

六、企业实际应用场景分析

七、程序发布

八、常用自动化运维工作

一、运维软件 Ansible

在生产生活中,如开发网站,包括有电商的程序,电商程序有一些业务发生变化,它里面程序会有更新这时需另外辅助软件如一些可直接实现这些自动化运维的工具,其中著名流行的软件就是 ansible,接下来将介绍 ansible:

1、运维自动化发展历程及技术应用

2、Ansible 命令使用

3、Ansible 常用模块详解

4、YAML 语法简介

5、Ansible playbook 基础

6、Playbook 变量、tags、handlers 使用

7、Playbook 模板 templates

8、Playbook 条件判断 when

9、Playbook 字典 with _ items

10、Ansible Roles


ansible 命令像 linux 中一条条命令,单条命令虽然能解决问题,但是很不灵活也不自动化,如需定期的做备份,每次敲命令去备份会很麻烦,一般来讲都写成脚本,在 ansible 中的解决方案就叫 playbook 翻译叫剧本

像电影电视剧中演员按照剧本表演一样,要实现复杂任务,单条命令输出费时费力,就可以借助 playbook,相当于把多个命令集中在 playbook 里形成了一个相对能解决复杂任务的工具,但过于复杂一点项目,一个 playbook 也搞不定,因此有最终的解决方案 Role,翻译叫角色,

一个 playbook 搞不定了,那就写多个 playbook,并保证各个 playbook 之间是有一定的关系,互相调用,那是用角色来实现。

学习顺序就是刚开始先了解基本命令,然后想实现稍微复杂的操作就编 playbook编角色。

这中间会用到很多相关的技术,如 ansible 的各种模块在实现功能的时候是基于模块来开发的某个功能他是用一个模块来实现另外一个功能。比方说我要实现文件复制,他就会开发一个和文件相关的一个模块,专门解决文件复制等等。

也看到条件判断、变量、标签等等、也有属于自己的语言 YAML,接下来逐步学习。总的简单理解 Ansible 是单条命令 playbook 综合命令为脚本,Roles 来调用各个脚本完成复杂任务。


二、运维自动化发展历程及技术应用

了解一下面试中可能问的大问题:

IAAS (基础设施即服务)PAAS(平台即服务)、SAAS(软件即服务)三者的区别:

在本地部署时,硬件与软件都是自己部署,像是在家吃饭,要买原材料,要生火,要桌子椅子来吃饭,但现阶段大部分公司没有能力或精力放到辅助IT上,所以就产生IAAS(基础设施即服务),就像吃饭买成品带回家,生火一热放上桌子就吃,若还嫌麻烦可以直接叫外卖 PAAS(平台即服务),也不用热直接上桌吃,此时觉得成本依然很高,可以直接去店里吃 SAAS(软件即服务),这时桌子都省了。

这样很大程度上节省了维护精力,

现大部分软件公司都采 SAAS,如手机上 app,就像计算机的发展,都从硬件向软件发展,省去很大精力可以投入到软件的研发中。

如下图:

image.png


IAAS:购买了硬件架构(如虚拟机),操作系统和软件自己开发。

PAAS: 不仅购买了硬件架构,也包括了操作系统,可以直接开发软件。

SAAS:全套购买(基本上各大手机软件都是如此)不需要自己开发。


三、云计算运维工程师核心职能

1、平台架构组建负责参与并审核架构设计的合理性和可运维性,搭建运维平台技术架构,通过开源解决方案,以确保在产品发布之后能高效稳定的运行,保障并不断提升服务的可用性,确保用户数据安全,提升用户体验。在正式上岗时企业里需要用到的服务器都是需要自己搭建的。

 

2、日常运营保障:负责用运维技术或者运维平台确保产品可以高效的发布上线,负责保障产品7*24H 稳定运行,在此期间对出现的各种问题可以快速定位并解决;在日常工作中不断优化系统架构和部署的合理性,以提升系统服务的稳定性。

维护公司自研的系统,像电商网站,就需要更迭版本,维护平时的稳定运行。如各种公司开发的软件,需要日常维护升级。

 

3、效率优化:用自动化的工具/平台提升软件在研发生命周期中的工程效率。不断优化系统架构、提升部署效率、优化资源利用率支持产品的不断迭代,需要不断的进行架构优化调整。以确保整个产品能够在功能不断丰富和复杂的条件下,同时保持高可用性。

 

四、运维工程师职能划分

如图:一一一一一一一一一一一一一一一一一一一一一一一一一一一

image.png

 

可以看到运维在开发软件中所处的位置,如电商网站开发的网页,有各种开发工程师和测试工程师,运维工程师在软件开发和测试后,进行预上线(配置修改、预发部署、发布验收)和上线(环境准备、上线部署、配置惨改、添加监控)。

 

五、自动化运维应用场景

自动化运维就是减轻运维工程师的日常工作,ansible 实现自动化的口令的功能大体分为:

文件传输(拷贝、更改文件)和命令执行(应用部署、配置管理、任务流编排),ansible 提出能解决系统化自动部署,但此时还仍未成功,但在之后或许会实现。

 

六、企业实际应用场景分析

1Dev 开发环境

使用者:程序员

功能:程序员开发软件,测试 BUG 的环境

管理者:程序员(此环节多为开发工程师负责)。

 

2、测试环境

使用者:QA 测试工程师

功能:测试经过 Dev 环境测试通过的软件的功能

管理者:运维

说明:测试环境往往有多套,测试环境满足测试功能即可,不宜过多。

(1) 测试人员希望测试环境有多套,公司的产品多产品线并发,即多个版本,意味着多个版本同步测试

(2) 通常测试环境有多少套和产品线数量保持一样

 

3、发布环境:代码发布机,有些公司为堡垒机(安全屏障)

使用者:运维

功能:发布代码至生产环境

管理者:运维(有经验)

发布机:往往需要有2台(主备)

 

4生产环境

使用者:运维,少数情况开放权限给核心开发人员,极少数公司将权限完全开放给开发人员并其维护。

功能:对用户提供公司产品的服务

管理者:只能是运维

生产环境服务器数量:一般比较多,且应用非常重要。往往需要自动工具协助部署配置应用。


5灰度环境(生产环境的一部分)

使用者:运维

功能:在全量发布代码前将代码的功能面向少量精准用户发布的环境,可基于主机或用户执行灰度发布

案例:共100台生产服务器,先发布其中的10台服务器,这10台服务器就是灰度服务器,此时仅发布10台机器,另90台还是老版本,若此时没有出现 BUG 就继续发布其他机器。

管理者:运维

灰度环境:往往该版本功能变更较大,为保险起见特意先让一部分用户优化体验该功能,待这部分用户使用没有重大问题的时候,再全量发布至所有服务器。同时也有地区发布,像有些软件是各个地区是不太一样的,先发布一地区然后再逐步到其它地区

 

七、程序发布

1、预发布验证:新版本的代码先发布到服务器(跟线上环境配置完全相同,只是未接入到调度器)。

 

2、程序发布要保证不能导致系统故障或造成系统完全不可用,影响用户体验。

 

3、发布路径:

/webapp/tuangou-1.1 此为旧版本

/webapp/tuangou  一     此软件基指向在使用的版本

/webapp/tuangou-1.2   此为新版本

用户一般使用的是 /webapp/tuangou 此为一个软链接,他一般通过调度器指向 /webapp/tuangou-1.1(旧版本),升级新版本时通过调度器把老版本 down掉,写入新版本  /webapp/tuangou-1.2  然后恢复链接,此时就完成了灰度发布。

 

4、发布过程:在调度器(用户将请求给调度器,调度器指引用户到提供服务的 real server)上下线一批主机(标记为 maintanance 状态)-->关闭服务-->部署新版本的应用程序-->启动服务-->在调度器上启用这一批服务器

 

5、自动化灰度发布:脚本、发布平台


八、常用自动化运维工具

1、Ansible:python,Agentless,中小型应用环境

2、Saltstack:python, 一般需部署 agent, 执行效率更高

3、Puppet:ruby, 功能强大,配置复杂,重型,适合大型环境

4、Fabric:python, agentless

5、Chef:ruby,国内应用少

6、Cfengine

7、func

相关文章
|
1月前
|
运维 应用服务中间件 Linux
自动化运维的利器:Ansible在配置管理中的应用
【10月更文挑战第39天】本文旨在通过深入浅出的方式,向读者展示如何利用Ansible这一强大的自动化工具来优化日常的运维工作。我们将从基础概念讲起,逐步深入到实战操作,不仅涵盖Ansible的核心功能,还会分享一些高级技巧和最佳实践。无论你是初学者还是有经验的运维人员,这篇文章都会为你提供有价值的信息,帮助你提升工作效率。
|
19天前
|
运维 Ubuntu 应用服务中间件
自动化运维之路:使用Ansible进行服务器管理
在现代IT基础设施中,自动化运维已成为提高效率和可靠性的关键。本文将引导您通过使用Ansible这一强大的自动化工具来简化日常的服务器管理任务。我们将一起探索如何配置Ansible、编写Playbook以及执行自动化任务,旨在为读者提供一条清晰的路径,从而步入自动化运维的世界。
|
16天前
|
运维 网络安全 Python
自动化运维:使用Ansible实现批量服务器配置
在快速迭代的IT环境中,高效、可靠的服务器管理变得至关重要。本文将介绍如何使用Ansible这一强大的自动化工具,来简化和加速批量服务器配置过程。我们将从基础开始,逐步深入到更复杂的应用场景,确保即使是新手也能跟上节奏。文章将不包含代码示例,而是通过清晰的步骤和逻辑结构,引导读者理解自动化运维的核心概念及其在实际操作中的应用。
|
17天前
|
运维 Ubuntu 网络协议
自动化运维:使用Ansible进行服务器配置管理
在现代IT架构中,自动化运维已成为提升效率、减少人为错误的关键。本文将介绍如何使用Ansible这一强大的自动化工具来简化和标准化服务器的配置管理过程。通过具体的代码示例和操作步骤,我们将展示如何快速部署应用、管理配置以及自动化日常任务,从而确保环境的一致性和可靠性。
|
1月前
|
运维 监控 安全
自动化运维的利剑:Ansible在现代IT架构中的应用
在数字化浪潮中,企业对IT系统的敏捷性和可靠性要求日益提高。Ansible,一种简单但强大的自动化运维工具,正成为现代IT架构中不可或缺的一部分。它通过声明式编程语言YAM,简化了系统配置、应用部署和任务自动化的过程,显著提升了运维效率和准确性。本文将深入探讨Ansible的核心特性、应用场景以及如何有效整合进现有IT环境,为读者揭示其在自动化运维中的实用价值和未来发展潜力。
|
29天前
|
运维 安全 Ubuntu
自动化运维:使用Ansible进行服务器配置管理
在现代IT基础设施中,自动化运维是确保高效、稳定和安全服务的关键。本文将深入介绍如何使用Ansible这一开源工具来简化服务器配置管理工作,从基础安装到高级应用,我们将一步步展示如何通过Ansible Playbooks实现自动化部署和维护,旨在帮助读者构建更加灵活和可扩展的运维体系。
42 7
|
28天前
|
运维 Ubuntu Linux
自动化运维:使用Ansible简化日常任务
在快节奏的IT世界中,时间就是一切。本文将揭示如何通过Ansible这一强大的自动化工具来节省宝贵的时间,从而提高效率和减少人为错误。我们将深入探讨Ansible的核心概念、安装过程以及如何编写简单的playbook来自动执行常见运维任务。无论你是新手还是有经验的系统管理员,这篇文章都将为你提供实用的知识和技能,让你能够更好地控制你的服务器环境。
|
29天前
|
运维 监控 网络协议
运维工程师日常工作中最常用的20个Linux命令,涵盖文件操作、目录管理、权限设置、系统监控等方面
本文介绍了运维工程师日常工作中最常用的20个Linux命令,涵盖文件操作、目录管理、权限设置、系统监控等方面,旨在帮助读者提高工作效率。从基本的文件查看与编辑,到高级的网络配置与安全管理,这些命令是运维工作中的必备工具。
117 3
|
1月前
|
运维 Devops 应用服务中间件
自动化运维的利剑:Ansible在现代IT架构中的应用
【10月更文挑战第42天】本文旨在揭示自动化运维工具Ansible如何革新现代IT架构,通过简化配置管理和部署流程,提升效率和可靠性。我们将探索Ansible的核心功能、语言特性以及其在DevOps文化中的角色。文章还将展示如何借助Ansible构建模块化和可重用的配置代码,实现快速迭代与部署,并确保系统一致性。通过阅读本文,运维人员将了解如何利用Ansible优化日常任务,加速产品上线速度,同时提高系统的稳健性。
38 5
|
1月前
|
运维 监控 应用服务中间件
自动化运维的利器:Ansible实战应用
【10月更文挑战第41天】在现代IT运维领域,自动化已成为提高效率、减少错误的关键。Ansible作为一种简单而强大的自动化工具,正被越来越多的企业采纳。本文将通过实际案例,展示如何使用Ansible简化日常运维任务,包括配置管理和批量部署等,旨在为读者提供一种清晰、易懂的自动化解决方案。
28 1

推荐镜像

更多