运维自动化工具ansible学习笔记

简介:

  利用五一假期的时间学习了下ansible,看了一天的官方文档,对其中需要注意的地方,做下笔记整理下思绪。

  一、简介

  Ansible是与puppet、saltstack类似的集群管理工具,其优点是仅需要ssh和Python即可使用,而不像puppet、saltstack那样都需要客户端。puppet与saltstack这2个软件都需要安装客户端,而saltstack与ansible很相似,都是属于python流的,但saltstack不是很稳定;puppet虽然稳定,但命令执行的时候,需要配置模块儿,非常麻烦,而且还需要安装客户端,学习成本高。ansible在性能方面并不弱于这两个工具,而且使用还并不繁琐,关键ansible是基于paramiko 开发的,paramiko是一个纯Python实现的ssh协议库。ansible不需要在远程主机上安装client/agents,因为它是基于ssh来和远程主机通讯的。

其他特性:

  1. ansible提供两种方式去完成任务,一是 ad-hoc 命令,一是写 Ansible playbook。前者可以解决一些简单的任务, 后者解决较复杂的任务。

  2. 它基于模块工作,可使用任意语言开发模块;

  3. 使用yaml语言定制剧本playbook;

一般而言,在学习了 playbooks 之后,你才能体会到 Ansible 真正的强大之处在哪里。

二、安装

  可以从github上安装,也可以用系统yum或apt源里安装,或者pip安装。方便起见,直接pip安装即可。

已ubuntu为例:

1
2
#apt-get install python-pip
#pip install ansible

三、基本使用

(1)ansible应用程序的主配置文件:/etc/ansible/ansible.cfg

需要注意的是,与远端节点交流是通过并行的机制,并行机制的方式可以通过传递 ``–orks``参数设置,或者在配置文件里面编辑。默认是5个线程,比较保守,如果你有足够的内存,可以设置为更大值。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
[defaults]
 
# some basic default values...
 
#inventory      = /etc/ansible/hosts
#library        = /usr/share/my_modules/
#remote_tmp     = $HOME/.ansible/tmp
#forks          = 5
forks          = 100
#poll_interval  = 15
#sudo_user      = root
#ask_sudo_pass = True
#ask_pass      = True
#transport      = smart
#remote_port    = 22
#module_lang    = C

(2) Host Inventory定义管控主机:/etc/ansible/hosts

/etc/ansible/hosts 文件的格式与windows的ini配置文件类似:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
10.13.25.3
 
badwolf.example.com:5309
 
[dbservers]
one.example.com
two.example.com
three.example.com
 
[webservers]
www[01:50].example.com
 
[databases]
db-[a:f].example.com

 其中:

  1. 单个主机一般放在server组的上面,可以用IP和域名;

  2. 方括号[]中是组名,用于对系统进行分类,便于对不同系统进行个别的管理;

  3. 如果有主机的SSH端口不是标准的22端口,可在主机名之后加上端口号,用冒号分隔。SSH 配置文件中列     出的端口号不会在 paramiko 连接中使用,会在 openssh 连接中使用。

  4. 一组相似的 hostname , 可简写

(3) 

ad-hoc命令:

ansible有许多模块,默认是 ‘command’,也就是命令模块,我们可以通过 -m 选项来指定不同的模块; -a 选项,指定模块 arguments

常用的模块:copy、command、service、yum、apt、file、raw、shell、script、cron、user、state、template、

E.g.

1
2
3
4
5
6
7
8
9
10
11
12
13
#ping 测试
$ sudo  ansible all -m  ping
 
#管理软件包
#安装
$ansible webservers -m apt -a  "name=lrzsz state=present"
#卸载
$ansible webservers -m apt -a  "name=lrzsz state=absent"
 
#启动服务
$ansible webservers -m service -a  "name=httpd state=started"
#停止服务
$ ansible webservers -m service -a  "name=httpd state=stopped"

wKiom1cl75bATTE8AAA5V-cnN1Q691.png

四、Ansible playbooks

  Playbooks 是 Ansible的配置,部署,编排语言.他们可以被描述为一个需要希望远程主机执行命令的方案,或者一组IT程序运行的命令集合。实际playbook就是一个用yaml语法把多个模块堆起来的一个文件。

1、其中,YAML 有一个小的怪癖,所有的 YAML 文件(无论和 Ansible 有没有关系)开始行都应该是 ---. 这是 YAML 格式的一部分, 表明一个文件的开始.

列表中的所有成员都开始于相同的缩进级别, 并且使用一个 "- " 作为开头(一个横杠和一个空格):

示例yml,安装http的yml:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
---
- hosts: webservers
   vars:
     http_port: 80
     max_clients: 200
   remote_user: root
   tasks:
   - name: ensure apache is at the latest version
     yum: pkg=httpd state=latest
   - name: write the apache config  file
     template: src= /srv/httpd .j2 dest= /etc/httpd .conf
     notify:
     - restart apache
   - name: ensure apache is running
     service: name=httpd state=started
   handlers:
     - name: restart apache
       service: name=httpd state=restarted

2、测试playbook,在openstack_test组里的主机上安装lftp,之后卸载lftp,最后启动mysql。

yml文件如下:

wKioL1cl8xOh_u0oAAA87gyu8F4782.png

运行截图,TASK,启动mysql显示FAILED,是因为这四台server上没有安装mysql软件,这里测试看下执行情况:

wKiom1cl8kPhubNoAAF4LPzNlAw555.png

注意的一点,在运行 playbook 时(从上到下执行),如果一个 host 执行 task 失败,这个 host 将会从整个 playbook 的 rotation 中移除. 如果发生执行失败的情况,请修正 playbook 中的错误,然后重新执行即可.

3、单独说下roles

  • roles用于实现“代码复用”。

  • roles只是把任务给分离出去了。只要在playbook文件中调用此role就可执行这些任务。

  • 如我们定义了一个很复杂的任务,但是要用在另外的主机组或只想用于单台主机的时候就要修改这个文件,总修改也不是办法。 可以复制多份,但有时候也不够灵活。 

  • 所以就可以用role把任务主体分离出来,只在playbook中写一些额外的东西,如变量,主机等等。

  • roles以特定的层次型格式组织起来playbook中的各主元素(vars, tasks, handlers)。每一个主元素都以一个目录来表示。

各目录如下:

  • files:此角色中用到的所有文件均放置于此目录中; 对应于copy模块。

  • templates:Jinja2模板文件存放位置;  对应于template模块。

  • tasks:任务列表文件;里面可以有多个文件,但至少有一个叫做main的文件;

  • handlers:处理器列表文件;里面可以有多个文件,但至少有一个叫做main的文件;

  • vars:变量字典文件;里面可以有多个文件,但至少有一个叫做main的文件;

  • meta:此角色的特殊设定及依赖关系;

Handlers 也是一些 task 的列表,通过名字来引用,它们和一般的 task 并没有什么区别.Handlers 是由通知者进行 notify, 如果没有被 notify,handlers 不会执行.不管有多少个通知者进行了 notify,等到 play 中的所有 task 执行完成之后,handlers 也只会被执行一次.

这里是一个 handlers 的示例:

1
2
3
4
5
handlers:
     - name: restart memcached
       service:  name=memcached state=restarted
     - name: restart apache
       service: name=apache state=restarted

Handlers 最佳的应用场景是用来重启服务,或者触发系统重启操作.除此以外很少用到了.

roles是非常伟大的产品,所以当我们写 playbooks 时官方推荐使用 roles。

下面是用playbook一键安装LAMP环境的示例,可参考其规范写ansible的playbook:

https://github.com/ansible/ansible-examples/tree/master/lamp_simple

附上ansible的中文翻译文档连接,建议参照英文的官方文档一起学习:

http://www.ansible.com.cn/





      本文转自Jx战壕  51CTO博客,原文链接: http://blog.51cto.com/xujpxm/1769369
,如需转载请自行联系原作者




相关文章
|
4月前
|
运维 Prometheus 监控
别再盲选了!开源运维工具选型这事儿,咱得说人话
别再盲选了!开源运维工具选型这事儿,咱得说人话
231 7
|
5月前
|
人工智能 运维 安全
基于合合信息开源智能终端工具—Chaterm的实战指南【当运维遇上AI,一场效率革命正在发生】
在云计算和多平台运维日益复杂的今天,传统命令行工具正面临前所未有的挑战。工程师不仅要记忆成百上千条操作命令,还需在不同平台之间切换终端、脚本、权限和语法,操作效率与安全性常常难以兼顾。尤其在多云环境、远程办公、跨部门协作频繁的背景下,这些“低效、碎片化、易出错”的传统运维方式,已经严重阻碍了 IT 团队的创新能力和响应速度。 而就在这时,一款由合合信息推出的新型智能终端工具——Chaterm,正在悄然颠覆这一现状。它不仅是一款跨平台终端工具,更是业内率先引入 AI Agent 能力 的“会思考”的云资源管理助手。
|
4月前
|
敏捷开发 运维 数据可视化
DevOps看板工具中的协作功能:如何打破开发、测试与运维之间的沟通壁垒
在DevOps实践中,看板工具通过可视化任务管理和自动化流程,提升开发与运维团队的协作效率。它支持敏捷开发、持续交付,助力团队高效应对需求变化,实现跨职能协作与流程优化。
|
7月前
|
运维 安全 Linux
试试Linux设备命令行运维工具——Wowkey
WowKey 是一款专为 Linux 设备设计的命令行运维工具,提供自动化、批量化、标准化、简单化的运维解决方案。它简单易用、高效集成且无依赖,仅需 WIS 指令剧本文件、APT 账号密码文件和 wowkey 命令即可操作。通过分离鉴权内容与执行内容,WowKey 让运维人员专注于决策,摆脱繁琐的交互与执行细节工作,大幅提升运维效率与质量。无论是健康检查、数据采集还是配置更新,WowKey 都能助您轻松应对大规模设备运维挑战。立即从官方资源了解更多信息:https://atsight.top/training。
|
7月前
|
数据采集 运维 安全
Linux设备命令行运维工具WowKey问答
WowKey 是一款用于 Linux 设备运维的工具,可通过命令行手动或自动执行指令剧本,实现批量、标准化操作,如健康检查、数据采集、配置更新等。它简单易用,只需编写 WIS 指令剧本和 APT 帐号密码表文件,学习成本极低。支持不同流派的 Linux 系统,如 RHEL、Debian、SUSE 等,只要使用通用 Shell 命令即可通吃Linux设备。
|
8月前
|
运维 安全 开发工具
GitHub 热门开源运维工具 Websoft9:如何实现服务器管理效率翻倍?
Websoft9 提供 200+ 开源应用一键部署,支持容器化隔离、GitOps 自动化和企业级安全防护,助力服务器管理效率提升 80%。
257 1
|
9月前
|
人工智能 运维 Kubernetes
运维联盟 SOMA 评测系统正式发布,让你的运维工具跑分更丝滑
通过对特定的业务系统进行故障注入,将不同的运维工具放在一起进行评估和评测。
|
1月前
|
数据采集 运维 监控
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
本文系统解析爬虫与自动化核心技术,涵盖HTTP请求、数据解析、分布式架构及反爬策略,结合Scrapy、Selenium等框架实战,助力构建高效、稳定、合规的数据采集系统。
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
|
2月前
|
运维 Linux 网络安全
自动化真能省钱?聊聊运维自动化如何帮企业优化IT成本
自动化真能省钱?聊聊运维自动化如何帮企业优化IT成本
98 4