小博无线CI系统演进之路

简介: 小博无线技术团队至2014年创建以来,这三年多以来所使用的CI系统经过数次升级换代,现已全部上云,全面实现了容器化和pipeline化,并引入了扁平和伸缩的实践来节省云计算成本。本文回顾了CI系统的成长历程。

小博无线技术团队至2014年创建以来,这三年多以来所使用的CI系统经过数次升级换代,现已全部上云,全面实现了容器化和pipeline化,并引入了扁平和伸缩的实践来节省云计算成本。本文回顾了CI系统的成长历程。

2014 - virtual box

2014年初,拼了一台16G内存的PC机,在上面开了多个virtual box,一个跑gitlab, 一个跑jenkins master, 剩下的几个就用于搭建build环境,作为jenkins的ssh slave。上线部署通过配置promotion plugin实现 - 先将build出来的release package scp到线上ecs, 再ssh运行一个安装升级脚本。

遇到的问题

  • virtual box比较重,很耗资源,16G内存也跑不了几个虚拟机
  • virtual box实例是长期存在的,每次build都要注意对应的cleanup操作,避免不同的build之间相互干扰
  • 每个虚拟机都需要单独的环境配置,复制成本高
  • scp+ssh的上线方式难以统一运作,基本上每个服务都需要定制;如果代码和配置都有变更,升级部署及回滚动作都可能相当复杂且风险较高

2015 - docker

2014年底,docker慢慢流行开来,容器比虚拟机要轻量很多,并且环境配置可以用Dockerfile很方便的以代码形式管理起来,我们便将原本以virtual box形式存在的jenkins slave都替换成了docker。

另外,将线上服务也容器化,将代码和配置统一装入一个docker image, 这样可以整体升级部署或回退,就消除了"代码和配置都有变更时,是先回滚配置,还是先回滚代码?"的难题。

遇到的问题

  • docker虽然解决了资源消耗的问题,但此时的docker仍然是作为长期存在的ssh slave来运行的,在build时仍然需要考虑对应的cleanup操作以避免不同的build之间相互干扰
  • 每个服务的相关CI配置仍然是用jenkins web ui进行配置,变更比较麻烦,并且需要jenkins的配置权限

2016 - Jenkins pipeline & docker plugin

6月份,办公室停了两次电,有一次竟长达两天!为了解决停电问题对上线迭代的影响,我们将位于办公室内的CI系统逐步迁移到了阿里云上。本地的数据备份和恢复是一件非常麻烦的事情,上云后,数据备份就方便多了。

另外,同年4月份Jenkins官方在新发布的Jenkins 2.0中开始全面推进pipeline,随着这次迁移,我们也一并实施了pipeline结合docker plugin的容器化改造。

pipeline化后,所有的build动作都通过代码仓库中的Jenkinsfile定义,完全不需要在jenkins的网页上进行配置,开发通过git push Jenkinsfile就能实现对CI流程的控制。

容器化后,CI的各种build环境也通过Dockerfile得以标准化,并且每次build的容器都是按需新建的,无需考虑cleanup操作。

2017 - mesos plugin & auto scaling

之前的docker plugin连接的docker cloud是一个单点ecs, 负责代码的编译,测试,打包,及部署操作,对于线上运行的各种微服务项目,还能应付,但如果用来跑编译路由器固件这种CPU密集型的任务,就力有未逮了。另一方面,预发布的测试集群由于流量很小,在绝大多数时候,各个节点的CPU都是空闲的。于是自然想到将预发布环境和CI环境进行扁平化:利用mesos plugin在预发布测试环境的mesos集群中集成jenkins framework, 用于运行容器化的jenkins slave。

固件编译虽然很耗CPU,但这只是一个耗时不到1小时的短任务,如果为了一天只做几次的build而多开几台包月ecs,会带来巨大的浪费。使用自动伸缩,当jenkins提示mesos资源不足时,利用API创建按量ecs加入mesos集群,等build完成后就将它释放掉,是一种高性价比的解法。

结论

系统化、标准化是降低成本,提升效率和质量的重要手段。2014年开始搭建CI系统时,build环境、部署环境、部署方式和配置方式都很零散,难以管理和维护。从2014-2017,先用容器标准化build环境和部署环境,并用pipeline标准化部署方式和配置方式,有效降低系统复杂度后,再用云计算资源降低电力供应和数据备份的风险和维护成本,最后用"扁平"与"伸缩"[1]降低云计算成本。


[1] 在云计算的五种基本实践方法 - "冗余, 漂移, 伸缩, 熔断, 扁平"中,"扁平"与"伸缩"是两种提高资源利用率,降低成本的方法,这方面的更多介绍请参考《云计算十字真言及其在小博无线的实践》一文 (https://yq.aliyun.com/articles/62686)

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3月前
|
传感器 数据采集 监控
基于阿里云MQTT服务,设计一个STM32的智能光伏控制系统
这篇文章详细介绍了利用STM32F103C8T6单片机实现光伏发电系统的关键技术。全文分为四章:第一章阐述了光伏发电的背景、意义及应用场景,强调其在绿色能源领域的重要性。第二章介绍了如何通过STM32F103C8T6及光敏电阻和伺服电机实现光线追踪系统,详细描述了硬件选择、连接及使用HAL库编写的单片机程序。第三章讲解了最大功率点追踪(MPPT)的原理,并展示了如何利用STM32F103C8T6和相关传感器、DC-DC转换器实现MPPT功能。第四章描述了如何通过STM32F103C8T6与SIM7600CE 4G模块连接到阿里云MQTT服务,实现设备状态数据的远程传输和控制。本文提供了全面的硬
17638 5
|
1月前
|
存储 边缘计算 安全
边缘计算设备的设计与部署技术探索
【8月更文挑战第1天】边缘计算设备的设计与部署是一个复杂而系统的工程,需要综合考虑多个方面的因素。通过制定全面的战略规划、选择合适的技术和设备、设计合理的网络架构、实施有效的安全策略以及定期管理维护等措施,可以确保边缘计算设备的稳定运行和高效应用。随着物联网和云计算技术的不断发展,边缘计算将在更多领域展现出其独特的优势和潜力。
39 10
|
存储 监控 安全
TG7100CWiFi&BLE双模芯片 一键连接AIoT平台让你快速自定义智能方案
面对市面上眼花缭乱的双模芯片,许多应用方案商往往挑花了眼,不知道该选择哪款。今天我们推荐是天猫精灵联合平头哥推出的TG7100CWiFi&BLE双模芯片。它具有低功耗、宽工作温度等特点,广泛适用于智能家居,电工照明等领域。
TG7100CWiFi&BLE双模芯片 一键连接AIoT平台让你快速自定义智能方案
|
4月前
|
物联网 5G 数据中心
|
数据中心 芯片
带你读《智慧光网络:关键技术、应用实践和未来演进》——2.3.3 相干光模块的光电器件技术的发展
带你读《智慧光网络:关键技术、应用实践和未来演进》——2.3.3 相干光模块的光电器件技术的发展
|
弹性计算 运维 Kubernetes
《2023云原生实战案例集》——01 汽车/制造——SKG未来穿戴 基于SAE打通CI/CD流程,实现高效运维
《2023云原生实战案例集》——01 汽车/制造——SKG未来穿戴 基于SAE打通CI/CD流程,实现高效运维
《2023云原生实战案例集》——01 汽车/制造——SKG未来穿戴  基于SAE打通CI/CD流程,实现高效运维
|
算法 光互联 机器学习/深度学习
带你读《智慧光网络:关键技术、应用实践和未来演进》——2.3.4 相干光模块的DSP 技术的发展
带你读《智慧光网络:关键技术、应用实践和未来演进》——2.3.4 相干光模块的DSP 技术的发展
|
5G 网络架构
5G 系统网络架构 | 带你读《5G 无线系统设计与国际标准》之四
为了适应各种部署场景,5G 支持了两种部署方式:一种为分布式部署,这种方式与 LTE系统类似,网络由基站组成,基站支持全协议栈的功能;另一种为集中式部署,基站进一步分为集中单元(CU,Centralized Unit)和分布单元(DU,Distributed Unit)两个节点,CU 和 DU 分别支持不同的协议栈和功能,
5G 系统网络架构  | 带你读《5G 无线系统设计与国际标准》之四