自动化部署难驾驭?这篇文章分分钟拯救你的运维体系!

简介:

作者介绍

徐亮伟江湖人称标杆徐,曾负责大规模集群架构自动化运维工作。擅长自动化运维,并且在分布式、Python自动化、云计算虚拟化等领域有较深入研究。个人博客:http://www.xuliangwei.com。

 

一、自动化部署代码实践

 

早期手动部署代码 
  1. 纯手动scp上传代码。

  2. 纯手动登陆,git pull 或者svn update。

  3. 纯手动xftp上传代码。

  4. 开发发送压缩包,rz上传,解压部署代码。

 

缺点:

  1. 全程运维参与,占用大量时间。

  2. 如果节点多,上线速度慢。

  3. 人为失误多,目录管理混乱。

  4. 回滚不及时,或者难以回退。

 

设计自动部署代码 

流程设计,确定目标。

 

1、自动部署环境

 

1)开发环境

开发者本地有自己的环境,运维配置公共开发环境,大家可共用的服务。例如:开发数据库MySQL,redis,Memcached等。

2)测试环境

功能测试以及性能测试。

3)预生产环境

生产环境集群中的某一个节点,并且连接生产库。(不对外,不做破坏型操作。)

4)灰度环境

根据不同的区域进行划分分。(生产环境)

5)生产环境

对用户提供服务的环境。

 

预生产环境由来:

  1. 数据库不一致,测试环境和生产环境数据库是不一样的。

  2. 使用生产环境的联调接口;例如:支付接口。(电商业务)

 

2、自动部署规划

 

  • 已经有一个可以上线的代码在git仓库。

  • 我们现在要做10个集群节点的一键部署,秒级回滚。

  • 所有的web服务,都应该使用普通用户。(强烈建议)

  • 所有的web服务都不应该监听80端口,除了负载均衡。

  • 那我们如何设计一套生产自动化部署系统。

 

  1. 规划。

  2. 实现。 

  3. 总结和扩展。(PDCA方法论) 

  4. 生产环境应用。

 

实现思路:

 

1)代码放置位置

Git(首先)、Svn

 

2)获取最新代码

  • 获取最新分支

  • 获取版本号

  • 获取tag包

 

3)差异解决

  • 各个节点之间差异

  • 代码仓库和实际的差异。配置文件是否放在代码仓库中。(配置单独进行存放,config.example )短信接口,支付,等敏感信息不让所有开发知道

  • 统一的.集群有10个节点。(Job节点 crontab.xml 配置文件不一样)

 

4)项目名称如何设计

项目名称_环境名称_版本_分支_时间_某开发提交

测试: rainbow_test_v1.1.1_dev_2016-08-11_12:12_xuliangwei

生产:rainbow_pro_v1.1.1_master_2016-08-11_11:11_xuliangwei

 

5)如何更新

php,tomcat需要重启,重新软链接。

 

6)如何测试

  • 测试(关键的页面,API,后台等)

  • 测试一个预生产环境,通过则继续部署,如果失败,退出部署操作。

 

7)记录日志

  • 可以部署统计。

  • 成功多少次。

  • 失败多少次。

  • 回滚多少次。

 

8)多人同时执行脚本

防止多人操作导致重复上线失败。通过lock锁对文件进行控制。

 

9)串行,并行

机器少的情况串行感觉不出什么。如果机器过多则会很慢。

 

分组部署并行部署,以及分组测试。

 

测试一个预生产环境,通过则继续部署,如果失败,退出部署操作。

 

10)部署服务器双机

防止部署系统down机,部署机代码丢失,误操作。

 

11)如何执行。

  • shell执行

  • web界面点击(自定义或jenkins)

 

12)如何实现正常回退,以及紧急回退(回滚的必要性)

通过软链接的方式来实现代码秒级别回退。

 

3、自动部署难点

 

在大公司推进自动化部署上线,是有许多的难点,根据个人公司的不同,来选择不同的方法来进行推进。

 

自动化推进难点:

  1. 能力(个人能力,团队能力)

  2. 责任(责任能否承担,敢于承担责任)

  3. 公司流程、人员、组织架构。

 

可通过如下方法推进:

  1. 目标化沟通。

  2. 责任划分

  3. ITIL

  4. 项目管理:PMBOOK

 

自动部署实践 

整个集群自动化部署流程设计如下:可根据如下思路,结合公司实际业务来编写shell脚本或者Python。 

 

  1. 获取最新代码

  2. 编译(可选)

  3. 配置文件(软连接或者拷贝)。

  4. 打包(tar,加速传输)

  5. 文件分发(Scp Rsync Salt)(不需要密码验证)

  6. 将目标服务器移除集群(注释配置文件)

  7. 解压

  8. 防止webroot站点目录

  9. scp差异文件(可能有一个节点配置文件不一样)

  10. 重启Web服务

  11. 测试

 

正常回退实践 
  1. 列出回滚版本 

  2. 目标服务器移除集群 

  3. 执行回滚 

  4. 重启并测试 

  5. 加入集群

 

紧急回退实践 
  1. 列出回滚版本(ls -l或find查出对应的历史版本)。 

  2. 执行回滚操作(删除软链接,重建软链接)。 

  3. 重启对应服务。

 

自动部署采坑 

自动化部署php环境或者java环境的过程中,那么你一定遇到了如下的问题。

 

  1. 如何应用到你的生产环境。

  2. 回退到“上一个”“正常”版本。

  3. 自动部署软连接的坑。

  1. PHP如果开启Opcache,需要重启PHP,或者清理opcache

  2. Java Tomcat是必须要重启,最好每次清理work,tmp缓存目录。

 

二、自动化系统构建实践

 

环境准备 

首先在执行脚本前,先做好初始化环境,最好是通过saltstack来完成。我这里没有那么多机器,就先用两台演示。

 

linux-node1 192.168.90.201

linux-node2 192.168.90.202

 

1、创建普通用户

useradd xuliangwei

passwd xuliangwei

 

2、配置密钥
 

\

 

3、创建相关目录

 

\

 

4、配置Nginx

 

\

 

5.配置好git环境

  • centos7部署gitlab 

  • 克隆项目

  • 最终效果如下:

\

 

剖析脚本 

查看脚本,具体配和第一部分来解读:

 

\

\

\

\

\

 

执行上线:

 

\

 

 查看当前版本

 

\

 

执行回滚操作

 

\

 

查看日志:

 

\

 

脚本其他功能 

当然此脚本功能不仅仅如此,可以通过git分支,git tag包等方式来上线,这些根据贵公司的具体业务来进行调整,也可以自己开发一个web界面来调用此脚本,这样就可以将上线工作交给开发,当然也可以使用开源jenkins来实现。

 

后期更新 

(如上脚本)+gitlab+jenkins+Sonar 构建自动化部署代码,并代码发布前质量管理。


本文来自云栖社区合作伙伴"DBAplus",原文发布时间:2016-08-23

目录
相关文章
|
24天前
|
运维 监控
现代运维中的自动化技术应用与挑战
现代运维工作中,自动化技术的应用已成为提高效率、降低成本的重要手段。本文探讨了自动化技术在运维领域的应用现状和挑战,包括自动化工具的选择、实施过程中的注意事项以及未来发展趋势。通过深入分析,帮助读者更好地理解和应用自动化技术,提升运维工作效率。
12 2
|
1月前
|
人工智能 运维 监控
现代运维中的自动化趋势与挑战
随着信息技术的快速发展,现代运维领域也面临着越来越多的挑战与机遇。本文将探讨当前运维中自动化的趋势以及相关的挑战,分析自动化在提高效率、降低成本等方面的重要性,并讨论未来运维领域的发展方向。
28 2
|
1月前
|
存储 BI 数据处理
Python自动化 | 解锁高效办公利器,Python助您轻松驾驭Excel!
Python自动化 | 解锁高效办公利器,Python助您轻松驾驭Excel!
|
4月前
|
弹性计算 运维 安全
带你读《云上自动化运维宝典》——万字长文带你了解 CloudOps自动化运维的奥秘,助力云上业务高效稳定运行(1)
带你读《云上自动化运维宝典》——万字长文带你了解 CloudOps自动化运维的奥秘,助力云上业务高效稳定运行(1)
376 1
|
4月前
|
弹性计算 运维 监控
带你读《云上自动化运维宝典》——多云基础设施的统一纳管与运维实践分享(2)
带你读《云上自动化运维宝典》——多云基础设施的统一纳管与运维实践分享(2)
106 1
|
4月前
|
弹性计算 运维 监控
带你读《云上自动化运维宝典》——如何使用OOS有效进行云上自动化运维(1)
带你读《云上自动化运维宝典》——如何使用OOS有效进行云上自动化运维(1)
253 0
|
4月前
|
弹性计算 运维 安全
带你读《云上自动化运维宝典》——如何使用OOS有效进行云上自动化运维(2)
带你读《云上自动化运维宝典》——如何使用OOS有效进行云上自动化运维(2)
246 1
|
6月前
|
运维 Cloud Native Go
Ansible自动化:简化你的运维任务
Ansible自动化:简化你的运维任务
61 0
|
4月前
|
Linux Shell 索引
Python自动化脚本-运维人员宝典第一章 Python脚本概述
在学习本书前,你应该了解一些 Python 编程的基础知识,比如基础语法、变量类型、元组数据类型、列表字典、函数、字符串和方法。在python.org/downloads/上有3.7.2和2.7.15两个版本可供下载。本书中我们将使用3.7这一版本来作为代表示例和包的安装。
236 11
|
1月前
|
Java 测试技术 Python
如何实现对iframe的自动化测试,一篇文章告诉你
如何实现对iframe的自动化测试,一篇文章告诉你
15 0

热门文章

最新文章