运维自动化之ansible
项目场景:
公司计划在年底做一次大型市场促销活动,全面冲刺下交易额,为明年的上市做准备。公司要求各业务组对年底大促做准备,运维部要求所有业务容量进行三倍的扩容,并搭建出多套环境可以共开发和测试人员做测试。
技术说明:
ansible聚集以上部署和命令执行于一身,能够完整轻易的实现应用部署和批量命令功能,适用于主机数量中型规模,再大的规模用puppet。
ansible是基于 paramiko 开发的,并且基于模块化工作,本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模块,ansible只是提供一种框架。ansible不需要在远程主机上安装client/agents,因为它们是基于ssh来和远程主机通讯的。
ansible工作模式:
Ansible系统由控制主机对被管节点的操作方式可分为两类,即ad- hoc和playbook:
ad-hoc模式(点对点)使用单个模块,支持批量执行单条命令。 ad-hoc 命令是一种可以快速输入的命令,而且不需要保存起来的命令。就相当于bash中的一句话shell。
playbook模式是Ansible主要管理方式,也是Ansible功能强大的关键所在。playbook通过多个task集合完成一类功能,如Web服务的安装部署、数据库服务器的批量备份等。可以简单地把playbook理解为通过组合多条ad-hoc操作作的配置文件。
ansible特点:
1、部署简单,只需在主控端部署Ansible环境,被控端无需做任何操作;
2、默认使用SSH协议对设备进行管理;
3、有大量常规运维操作模块,可实现日常绝大部分操作。
4、配置简单、功能强大、扩展性强;
5、支持API及自定义模块,可通过Python轻松扩展;
6、通过Playbooks来定制强大的配置、状态管理;
7、轻量级,无需在客户端安装agent,更新时,只需在操作机上进行一次更新即可;
8、提供一个功能强大、操作性强的Web管理界面和REST API接口 ——AWX平台。
Ansiblie命令执行过程
1、加载自己的配置文件 默认/etc/ansible/ansible.cfg
2、查找对应的主机配置文件,找到要执行的主机或者组
3、加载自己对应的模块文件,如command
4、通过ansible将模块或命令生成对应的临时py文件,并将该文件传输至远程服务器
5、对应主机执行用户的家目录的.ansible/tmp/XXX/XXX.PY文件
6、给文件+x执行
7、执行并返回结果
8、删除临时py文件,sleep 0退出
Ansible常用命令集
/usr/bin/ansible 临时命令执行工具,常用于临时命令的执行。
/usr/bin/ansible-doc 模块功能查看工具。
/usr/bin/ansible-playbook 定制自动化的任务集编排工具,即按照剧本执行命令的
常用命令示例:
查看模块列表:ansible-doc -l
获取指定模块的使用帮助:ansible-doc -s MOD_NAME
临时命令执行:ansible <host-pattern> [-f forks] [-m module_name] [-a args] [-C] [-v]
Host-pattern指明单个主机或者主机组
-f 指定并发连接数
-m 指明使用的模块
-a 指明使用的模块参数
-C表示只是测试而不真正执行,可以用来预测
-v 显示详细信息,还可以使用-vv、-vvv、....
项目准备:
Ansible服务器node1:ip:172.17.13.134
主机组web:node2及node3:ip:172.17.13.135 172.17.13.136
项目实现:
一、安装ansible,有两种方式,任选一种即可
1、使用yum安装:yum install ansible -y
2、使用pip(python的包管理模块)安装:yum install python-pip;pip install ansible
二、配置ansible使用公钥验证,实现无密码远程连接:
虽然ansible支持其他主机认证方式,但是我们最常用的的还是基于秘钥的认证:
1、首先生成秘钥
ssh-keygen -t rsa -P ''
2、然后向主机分发秘钥:
ssh-copy-id [root@]ip #@后面跟主机名或者IP地址
实现效果:无密码连接
三、配置主机组:
在/etc/ansible/hosts文件中加入主机组
比如[web]
172.17.13.135
172.17.13.136 表示在web主机组里配置两个主机
组成员也可以使用通配符来匹配,如下 172.17.13.[135:137] #表示匹配从172.17.13.135-172.17.13.137的主机。
也可以直接添加主机而不需要主机组。
四、主机连通性测试:
ansible web -m ping
五、利用Ansible的模块来实现运维自动化
1、Command
命令模块接受命令名称,后面是空格分隔的列表参数。给定的命令将在所有选定的节点上执行。它不会通过shell进行处理,比如$HOME操作和”小于”<“,”>”, “|”, “;”,”&”等操作。
Command模块的参数:
①chdir # 在执行命令之前,先切换到该目录
示例:切换到/tmp目录之后再使用ls查看文件
ansible web -m command -a 'chdir=/tmp ls'
②creates # 一个文件名,当这个文件存在,则该命令不执行,可以用来做判断
示例:当/tmp存在则不执行后面的命令
ansible web -m command -a 'creates=/tmp ls'
③executable # 切换shell来执行命令,需要使用命令的绝对路径
④free_form # 要执行的Linux指令,一般使用Ansible的-a参数代替。
⑤removes # 一个文件名,这个文件不存在,则该命令不执行,与creates相反的判断
示例:当/tmp存在则执行后面的命令
ansible web -m command -a 'removes=/tmp ls'
2、shell模块在远程主机上调用shell解释器运行命令,支持shell的各种功能,例如管道等
示例:过滤出/etc/passwd文件中的root
ansible web -m shell -a 'cat /etc/passwd |grep "root"'
3、copy:复制文件到远程主机,可以改权限等
用法:
(1) 复制文件
-a “src= dest= ”
(2) 给定内容生成文件
-a 'content= dest= mode="'
相关选项如下:
backup:在覆盖之前,将源文件备份,备份文件包含时间信息。yes|no代表备份|不备份
content:用于替代“src”,可以直接设定指定文件的内容
dest:必选项。要将源文件复制到的远程主机的绝对路径,如果源文件是一个目录,那么该路径也必须是个目录
mode:设定权限
directory_mode:递归设定目录的权限,默认为系统默认权限
force:如果目标主机包含该文件,但内容不同,如果设置为yes,则强制覆盖,如果为no,则只有当目标主机的目标位置不存在该文件时,才复制。默认为yes
others:所有的file模块里的选项都可以在这里使用
src:被复制到远程主机的本地文件,可以是绝对路径,也可以是相对路径。如果路径是一个目录,它将递归复制。在这种情况下,如果路径使用“/”来结尾,则只复制目录里的内容,如果没有使用“/”来结尾,则包含目录在内的整个内容全部复制,类似于rsync。
示例:
①对web主机组的主机创建/tmp/test.ansible文件,内容为hello\nworld,权限为666:
ansible web -m copy -a 'content="hello\nworld" dest=/tmp/test.ansible mode=666'
②拷贝本机的图片到对应主机组中主机的/data/photo,权限为644,且覆盖之前备份:
ansible web -m copy -a 'src=/root/2345_image_file_copy_2.jpg dest=/data/photo mode=644 backup=yes'
4、file 设置文件属性:
创建目录:-a “path= state=directory”
创建链接文件:-a “path= src= state=link”
删除文件:-a “path= state=absent”
参数使用:
force:需要在两种情况下强制创建软链接,一种是源文件不存在,但之后会建立的情况下;另一种是目标软链接已存在,需要先取消之前的软链,然后创建新的软链,有两个选项:yes|no代表是否强制创建
group:定义文件/目录的属组
mode:定义文件/目录的权限
owner:定义文件/目录的属主
path:必选项,定义文件/目录的路径
recurse:递归设置文件的属性,只对目录有效
src:被链接的源文件路径,只应用于state=link的情况
dest:被链接到的路径,只应用于state=link的情况
state:
directory:如果目录不存在,就创建目录
file:即使文件不存在,也不会被创建
link:创建软链接
hard:创建硬链接
touch:如果文件不存在,则会创建一个新的文件,如果文件或目录已存在,则更新其最后修改时间
absent:删除目录、文件或者取消链接文件
示例:
ansible web -m file -a 'path=/data/webapp state=directory' 创建目录
ansible web -m file -a 'path=/data/webapp state=absent' 删除目录
ansible web -m file -a 'path=/data/img src=/data/photo state=link' 创建软链接
ansible web -m file -a 'dest=/data/img2 src=/data/photo state=link' 创建软链接
ansible web -m file -a 'path=/data/haha state=touch' 创建文件
5、fetch 从远程某主机获取文件到本地:
dest:用来存放文件的目录
例如存放目录为backup,源文件名称为/etc/profile,在主机pythonserver中,那么保存为/backup/pythonserver/etc/profile
Src:在远程拉取的文件,并且必须是一个file,不能是目录
示例:
ansible web -m fetch -a 'src=/data/photo dest=/data/photo'
6、cron 管理cron计划任务:
-a “”: 设置管理节点生成定时任务
action:
cron backup= # 如果设置,则根据其值(yes|no)确定是否创建一个crontab备份
cron_file= #如果指定, 使用这个文件cron.d,而不是单个用户
day= #应该运行的工作日( 1-31, *, */2)
hour= # 小时 ( 0-23, *, */2 )
minute= #分钟( 0-59, *, */2 )
month= # 月( 1-12, *, /2 )
weekday # 周 ( 0-6 for Sunday-Saturday,, )
job= #指明运行的命令是什么
name= #定时任务描述
reboot # 任务在重启时运行,不建议使用,建议使用special_time
special_time #特殊的时间范围,参数:reboot(重启时),annually(每年),monthly(每月),weekly(每周),daily(每天),hourly(每小时)
state #指定状态,present表示添加定时任务,也是默认设置。absent 表示删除定时任务
user # 以哪个用户的身份执行
示例:每天同步一次时间:
ansible web -m cron -a 'name="ntp" special_time=daily job="/sbin/ntpdate 172.17.0.1 &>/dev/null"'
每五分钟同步一次时间:
ansible web -m cron -a 'name="ntp update" minute="*/5" job="/sbin/ntpdate 172.17.0.1 &>/dev/null"'
在web主机组对应的主机查看计划任务
ansible web -m cron -a 'name="ntp update" minute="*/5" job="/sbin/ntpdate 172.17.0.1 &>/dev/null" state=absent' 删除计划任务
7、yum 安装软件
conf_file #设定远程yum安装时所依赖的配置文件。
disable_gpg_check #是否禁止GPG checking,只用于`present‘ or `latest’。
disablerepo #临时禁止使用yum库。 只用于安装或更新时。
enablerepo #临时使用的yum库。只用于安装或更新时。
name= #所安装的包的名称,可以是软件,也可以是rpm包
state= #present安装, latest安装最新的, absent 卸载软件。
update_cache #强制更新yum的缓存。
示例:
ansible web -m yum -a 'name=htop state=present disable_gpg_check=yes' 安装htop
ansible web -m yum -a 'name=htop state=absent disable_gpg_check=yes' 卸载htop
8、service: 服务程序管理
arguments #命令行提供额外的参数
enabled #设置开机启动,true|false,yes|no
name= #服务名称
runlevel #开机启动的级别,一般不用指定。
sleep #在重启服务的过程中,是否等待。如sleep 2在服务关闭以后等待2秒再启动。
state #started启动服务, stopped停止服务, restarted重启服务, reloaded重载配置
示例:启动nginx服务并设置开机自启动:
ansible web -m service -a 'name=nginx state=started enabled=true'
重启nginx服务,在服务关闭两秒后再启动:
ansible web -m service -a 'name=nginx state=restarted sleep=2s'
9、user 用户模块,管理用户帐号action: user
comment # 用户的描述信息
createhome # 是否创建家目录
force # 在使用state=absent时, 行为与userdel force一致.
group # 指定基本组
groups # 指定附加组,如果指定为(groups=)表示删除所有组
home # 指定用户家目录
move_home # 如果设置为home=时, 试图将用户主目录移动到指定的目录
name # 指定用户名
non_unique # 该选项允许改变非唯一的用户ID值
password # 指定用户密码.指定完之后使用openssh加密,将加密密码写进/etc/shadow
remove # 在使用state=absent时, 行为与userdel remove一致
shell # 指定默认shell
state # 设置帐号状态,不指定为创建,指定值为absent表示删除
system # 当创建一个用户,设置这个用户是系统用户。这个设置不能更改现有用户
uid # 指定用户的uid
示例:创建用户tom,密码123456,uid1066,默认shell为/bin/bash
ansible web -m user -a 'name=tom password=123456 uid=1066 shell=/bin/bash'
创建用户tom并指明uid,主组,附加组,默认shell,家目录
ansible web -m user -a 'name=tom comment="tom is tom" uid=1066 group=tom groups=wheel
shell=/bin/zshell home=/home/tomhome'
10、group 用户组模块,添加或删除组
action: group
gid # 设置组的GID号
name= # 管理组的名称
state # 指定组状态,默认为创建,设置值为absent为删除
system # 设置值为yes,表示为创建系统组
示例:创建名为tom的组
ansible web -m group -a 'name=tom state=present'
11、script 在指定节点运行服务端的脚本
vim test.sh
#/bin/bash
touch /tmp/test.sh.log
echo “hello” >> /tmp/test.sh.log
加执行权限:chmod +x test.sh
执行:ansible web -m script -a ‘/root/test.sh’
查看效果:ansible web -m shell -a ‘cat /tmp/test.sh.log’
12、setup模块
facts组件是Ansible用于采集被管机器设备信息的一个功能,我们可以使用setup模块查机器的所有facts信息,可以使用filter来查看指定信息。整个facts信息被包装在一个JSON格式的数据结构中,ansible_facts是最上层的值。
facts就是变量,内建变量 。每个主机的各种信息,cpu颗数、内存大小等。会存在facts中的某个变量中。调用后返回很多对应主机的信息,在后面的操作中可以根据不同的信息来做不同的操作。如redhat系列用yum安装,而debian系列用apt来安装软件。
setup模块,主要用于获取主机信息,在playbooks里经常会用到的一个参数gather_facts就与该模块相关。setup模块下经常使用的一个参数是filter参数。
示例:
ansible web -m setup 获取web主机组里主机的所有信息
ansible web -m setup -a 'filter=ansible_*_mb' //查看主机内存信息
ansible web -m setup -a 'filter=ansible_eth[0-2]' //查看接口为eth0-2的网卡信息
ansible all -m setup --tree /tmp/facts //将所有主机的信息输入到/tmp/facts目录下,每台主机的信息输入到对应主机名文件中(/etc/ansible/hosts里的主机名)
项目总结:
以上都是命令行式的操作,操作比较繁琐,而且不容易排错与维护,所以我们可以使用Ansible playbook来实现。具体用法参看博客:http://blog.51cto.com/13150617/2048228