自动化部署难驾驭?这篇文章分分钟拯救你的运维体系!

简介:

作者介绍

徐亮伟江湖人称标杆徐,曾负责大规模集群架构自动化运维工作。擅长自动化运维,并且在分布式、Python自动化、云计算虚拟化等领域有较深入研究。个人博客:http://www.xuliangwei.com。

 

一、自动化部署代码实践

 

早期手动部署代码
 
  1. 纯手动scp上传代码。

  2. 纯手动登陆,git pull 或者svn update。

  3. 纯手动xftp上传代码。

  4. 开发发送压缩包,rz上传,解压部署代码。

 

缺点:

  1. 全程运维参与,占用大量时间。

  2. 如果节点多,上线速度慢。

  3. 人为失误多,目录管理混乱。

  4. 回滚不及时,或者难以回退。

 

设计自动部署代码
 

流程设计,确定目标。

 

1、自动部署环境

 

1)开发环境

开发者本地有自己的环境,运维配置公共开发环境,大家可共用的服务。例如:开发数据库MySQL,redis,Memcached等。

2)测试环境

功能测试以及性能测试。

3)预生产环境

生产环境集群中的某一个节点,并且连接生产库。(不对外,不做破坏型操作。)

4)灰度环境

根据不同的区域进行划分分。(生产环境)

5)生产环境

对用户提供服务的环境。

 

预生产环境由来:

  1. 数据库不一致,测试环境和生产环境数据库是不一样的。

  2. 使用生产环境的联调接口;例如:支付接口。(电商业务)

 

2、自动部署规划

 

  • 已经有一个可以上线的代码在git仓库。

  • 我们现在要做10个集群节点的一键部署,秒级回滚。

  • 所有的web服务,都应该使用普通用户。(强烈建议)

  • 所有的web服务都不应该监听80端口,除了负载均衡。

  • 那我们如何设计一套生产自动化部署系统。

 

  1. 规划。

  2. 实现。 

  3. 总结和扩展。(PDCA方法论) 

  4. 生产环境应用。

 

实现思路:

 

1)代码放置位置

Git(首先)、Svn

 

2)获取最新代码

  • 获取最新分支

  • 获取版本号

  • 获取tag包

 

3)差异解决

  • 各个节点之间差异

  • 代码仓库和实际的差异。配置文件是否放在代码仓库中。(配置单独进行存放,config.example )短信接口,支付,等敏感信息不让所有开发知道

  • 统一的.集群有10个节点。(Job节点 crontab.xml 配置文件不一样)

 

4)项目名称如何设计

项目名称_环境名称_版本_分支_时间_某开发提交

测试: rainbow_test_v1.1.1_dev_2016-08-11_12:12_xuliangwei

生产:rainbow_pro_v1.1.1_master_2016-08-11_11:11_xuliangwei

 

5)如何更新

php,tomcat需要重启,重新软链接。

 

6)如何测试

  • 测试(关键的页面,API,后台等)

  • 测试一个预生产环境,通过则继续部署,如果失败,退出部署操作。

 

7)记录日志

  • 可以部署统计。

  • 成功多少次。

  • 失败多少次。

  • 回滚多少次。

 

8)多人同时执行脚本

防止多人操作导致重复上线失败。通过lock锁对文件进行控制。

 

9)串行,并行

机器少的情况串行感觉不出什么。如果机器过多则会很慢。

 

分组部署并行部署,以及分组测试。

 

测试一个预生产环境,通过则继续部署,如果失败,退出部署操作。

 

10)部署服务器双机

防止部署系统down机,部署机代码丢失,误操作。

 

11)如何执行。

  • shell执行

  • web界面点击(自定义或jenkins)

 

12)如何实现正常回退,以及紧急回退(回滚的必要性)

通过软链接的方式来实现代码秒级别回退。

 

3、自动部署难点

 

在大公司推进自动化部署上线,是有许多的难点,根据个人公司的不同,来选择不同的方法来进行推进。

 

自动化推进难点:

  1. 能力(个人能力,团队能力)

  2. 责任(责任能否承担,敢于承担责任)

  3. 公司流程、人员、组织架构。

 

可通过如下方法推进:

  1. 目标化沟通。

  2. 责任划分

  3. ITIL

  4. 项目管理:PMBOOK

 

自动部署实践
 

整个集群自动化部署流程设计如下:可根据如下思路,结合公司实际业务来编写shell脚本或者Python。 

 

  1. 获取最新代码

  2. 编译(可选)

  3. 配置文件(软连接或者拷贝)。

  4. 打包(tar,加速传输)

  5. 文件分发(Scp Rsync Salt)(不需要密码验证)

  6. 将目标服务器移除集群(注释配置文件)

  7. 解压

  8. 防止webroot站点目录

  9. scp差异文件(可能有一个节点配置文件不一样)

  10. 重启Web服务

  11. 测试

 

正常回退实践
 
  1. 列出回滚版本 

  2. 目标服务器移除集群 

  3. 执行回滚 

  4. 重启并测试 

  5. 加入集群

 

紧急回退实践
 
  1. 列出回滚版本(ls -l或find查出对应的历史版本)。 

  2. 执行回滚操作(删除软链接,重建软链接)。 

  3. 重启对应服务。

 

自动部署采坑
 

自动化部署php环境或者java环境的过程中,那么你一定遇到了如下的问题。

 

  1. 如何应用到你的生产环境。

  2. 回退到“上一个”“正常”版本。

  3. 自动部署软连接的坑。

  1. PHP如果开启Opcache,需要重启PHP,或者清理opcache

  2. Java Tomcat是必须要重启,最好每次清理work,tmp缓存目录。

 

二、自动化系统构建实践

 

环境准备
 

首先在执行脚本前,先做好初始化环境,最好是通过saltstack来完成。我这里没有那么多机器,就先用两台演示。

 

linux-node1 192.168.90.201

linux-node2 192.168.90.202

 

1、创建普通用户

useradd xuliangwei

passwd xuliangwei

 

2、配置密钥
 

\

 

3、创建相关目录

 

\

 

4、配置Nginx

 

\

 

5.配置好git环境

  • centos7部署gitlab 

  • 克隆项目

  • 最终效果如下:

\

 

剖析脚本
 

查看脚本,具体配和第一部分来解读:

 

\

\

\

\

\

 

执行上线:

 

\

 

 查看当前版本

 

\

 

执行回滚操作

 

\

 

查看日志:

 

\

 

脚本其他功能
 

当然此脚本功能不仅仅如此,可以通过git分支,git tag包等方式来上线,这些根据贵公司的具体业务来进行调整,也可以自己开发一个web界面来调用此脚本,这样就可以将上线工作交给开发,当然也可以使用开源jenkins来实现。

 

后期更新
 

(如上脚本)+gitlab+jenkins+Sonar 构建自动化部署代码,并代码发布前质量管理。


本文来自云栖社区合作伙伴"DBAplus",原文发布时间:2016-08-23

目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 运维
构建高效运维体系:从自动化到智能化的演进
本文探讨了如何通过自动化和智能化手段,提升IT运维效率与质量。首先介绍了自动化在简化操作、减少错误中的作用;然后阐述了智能化技术如AI在预测故障、优化资源中的应用;最后讨论了如何构建一个既自动化又智能的运维体系,以实现高效、稳定和安全的IT环境。
74 4
|
2月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
63 4
|
3月前
|
机器学习/深度学习 运维 Prometheus
构建高效运维体系:从自动化部署到智能监控的全方位实践
在当今数字化时代,企业对运维效率和稳定性的要求越来越高。本文将探讨如何构建一个高效的运维体系,从自动化部署、持续集成与持续交付(CI/CD)、智能监控、故障管理以及数据驱动决策等方面进行深入分析和实践指导。通过这些方法,企业可以实现更快速、更可靠的软件发布和问题解决,提升整体运营效率。
|
18天前
|
机器学习/深度学习 运维 监控
智能化运维:从自动化到AIOps的演进之路####
本文深入探讨了IT运维领域如何由传统手工操作逐步迈向高度自动化,并进一步向智能化运维(AIOps)转型的过程。不同于常规摘要仅概述内容要点,本摘要将直接引入一个核心观点:随着云计算、大数据及人工智能技术的飞速发展,智能化运维已成为提升企业IT系统稳定性与效率的关键驱动力。文章详细阐述了自动化工具的应用现状、面临的挑战以及AIOps如何通过预测性分析和智能决策支持,实现运维工作的质变,引领读者思考未来运维模式的发展趋势。 ####
|
18天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的崛起背景,深入分析了其核心概念、关键技术、应用场景及面临的挑战,并对比了传统IT运维模式,揭示了AIOps如何引领运维管理向更高效、智能的方向迈进。通过实际案例分析,展示了AIOps在不同行业中的应用成效,为读者提供了对未来智能运维趋势的洞察与思考。 ####
43 1
|
1月前
|
机器学习/深度学习 数据采集 人工智能
智能运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的兴起背景、核心组件及其在现代IT运维中的应用。通过对比传统运维模式,阐述了AIOps如何利用机器学习、大数据分析等技术,实现故障预测、根因分析、自动化修复等功能,从而提升系统稳定性和运维效率。文章还深入分析了实施AIOps面临的挑战与解决方案,并展望了其未来发展趋势。 ####
|
1月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
58 4
|
2月前
|
运维 jenkins 持续交付
自动化部署的魅力:如何用Jenkins和Docker简化运维工作
【10月更文挑战第7天】在现代软件开发周期中,快速且高效的部署是至关重要的。本文将引导你理解如何使用Jenkins和Docker实现自动化部署,从而简化运维流程。我们将从基础概念开始,逐步深入到实战操作,让你轻松掌握这一强大的工具组合。通过这篇文章,你将学会如何利用这些工具来提升你的工作效率,并减少人为错误的可能性。
|
2月前
|
运维 Prometheus 监控
运维中的自动化实践每月一次的系统维护曾经是许多企业的噩梦。不仅因为停机时间长,更因为手动操作容易出错。然而,随着自动化工具的引入,这一切正在悄然改变。本文将探讨自动化在IT运维中的重要性及其具体应用。
在当今信息技术飞速发展的时代,企业对系统的稳定性和效率要求越来越高。传统的手动运维方式已经无法满足现代企业的需求。自动化技术的引入不仅提高了运维效率,还显著降低了出错风险。本文通过几个实际案例,展示了自动化在IT运维中的具体应用,包括自动化部署、监控告警和故障排除等方面,旨在为读者提供一些实用的参考。
|
2月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
【10月更文挑战第1天】智能化运维:机器学习在故障预测和自动化响应中的应用
70 3