Microservices 场景下的持续部署 | 吕健

简介: 内容简介 近两年作者在海外交付中参与 microservices 下的团队,为客户提升 Finance 系统的扩展性。作者所在团队,3 对开发(pair programming, 2 个 dev 为 pair)为客户支撑着 11 个 services,持续部署流水线(CD pipeline)是其中

内容简介

近两年作者在海外交付中参与 microservices 下的团队,为客户提升 Finance 系统的扩展性。作者所在团队,3 对开发(pair programming, 2 个 dev 为 pair)为客户支撑着 11 个 services,持续部署流水线(CD pipeline)是其中必不可少的一个技术实践。本次分享作者将从实践的角度分享 microservices 架构下的持续部署(CD)。 内容概述
  1. 1. microservice 概述:简要介绍 microservice 架构下的挑战

  2. 2. 持续部署实践:这里会提到『Build Pipeline as Code』,『Infrastructure as Code』等概念。

  3. 3. 持续部署了之后呢? 这里会介绍 CD 结合团队的敏捷开发流程的实践经验。

microservices 概述

当提到 microservice 的时候,我们通常会从下图开始:3058b519cfac1fccc22764bfda659c357510fd1b
为了从业务和技术方面得到更好的扩展能力,我们将单一架构的系统(Monolithic architecture),拆分成若干的微服务(Microservices architecture),这种拆分是架构演进的一个过程。在整个拆分过程中,对团队的组织架构,数据的管理方式,部署监控技术方面都带来极大的挑战。持续部署(简称 CD)是 microservices 架构中一个必备的实践之一。本文将介绍基于Docker 的 CD 方式。

部署方面带来的挑战

ab9c6b42b635adad55aafb793a17cb54fc0451ad
单一架构下(Monolithic),我们的系统 Code base 可以在一个项目中,这个系统采用一个持续集成(简称:CI) pipeline,并且此时我们也可以采用持续集成(简称:CD)pipeline,最终将系统持续部署到生产环境中。在这种情况下,每当系统引入一个改变的时候,CI,CD pipe line 都会执行一次。例如:
  • - 10 mins Unit Test
  • - 2 hours Acceptance Test
  • - 15 mins package
  • - 20 mins deployment
上面列举的例子并不算坏,更庞大的系统可能会需要更多的时间。当我们将 Monolithic 系统拆分成多个 micro services 时,并且将每个 services 进行独立部署。每当系统引入一个改变的时候(code change),它只会影响个别 service,我们只需要部署发生改变的部署,从新运行一个 service 的 CI,CD pipeline:
  • - 1 mins Unit Test
  • - 1 mins Integration test
  • - 5 mins package
  • - 5 mins deployment
这种拆分之后,更符合我们对解耦的追求: 『当代码引入一个改变的时候,它应该影响的改动最小』此时所提到的改变涉及整个开发流程,从代码到部署的影响做到了最小。拆分 services 之后的代价是,每个 service 都需要独立部署,我们需要为每个 service 搭建 CD pipeline。在 microservices 场景下,不同的 service 按照需求可能会采用不同的技术栈。并且在每次新建 service 时,配套的日志,监控,报警系统也需要进行配置。这个对 CD 提出了很大的挑战。

持续部署方面的实践

当我们谈持续部署的时候,此时也会包括持续集成。持续部署的整个过程会从代码 push 到 master 开始: 4dc59572faa8d9ffefc34a15d9e3bc525579451b
我们采用 Docker 来解决技术栈差异的问题,DevOps 创建部署工具将部署,监控,报警等配置模板化。实践:
  • - 使用 Docker 构建和发布 service
  • - 采用 Docker Compose 运行测试
  • - 使用 Docker 进行部署
准则:
  • - Build pipe line as Code
  • - Infrastructure as Code(base on AWS)
  • - 共享构建脚本

使用 Docker 构建和发布 service

c0dbcb3378e04d055535391e0854dbd785969287
  • - 使用 Docker 构建 service,service 已 docker image 的方式发布
  • - 将 docker 发布到 docker registry
  • - 从 docker registry 上 pull docker image 进行部署

使用 Docker Compose 运行测试

91898fb8c5d214a5834eee679f5e73ef002ba68f
Docker Compose可以将多个 docker image 进行组合。有些 service 需要访问数据,我们可以通过 docker compose 将 service image 和 database image 组合在一起。组合之后,我们可以采用 docker compose 运行持续集成。下面这个实例展示如何进行这种组合: https://gist.github.com/lvjian700/7c295e6a596e96526049f831d0eb8b13#file-docker-compose-yml

Build pipeline as Code

25225953f1c4ad9b227a13ed10b4afd2daccc781
通常我们使用  Jenkins 或者  Bamboo 来搭建 CI/CD pipeline,每次创建 pipeline 需要进行大量的手工配置,此时很难自动化 CI 服务器配置。Build pipeline as Code,即使用代码来描述 pipeline,这样做可以带来非常好的可读性和重用性。我们可以很容易的做到 CI 服务器配置。今年团队将所有 pipeline 从 Bamboo 迁移到了  BuildKite。在 BuildKite 上可以使用如下代码描述上图的 pipeline: https://gist.github.com/lvjian700/7c295e6a596e96526049f831d0eb8b13#file-buildkite-yml

Infrastructure as Code

41c7212ba30de454818eb5503054dddac3d249c2
如果我们要发布一个基于 HTTP 协议的 REST-ful API service,我们需要 service 准备如下基础设施(Infrastructure):
  • - 可部署的机器
  • - 机器的 IP 和网络配置
  • - 设备硬件监控服务(GPU,Memory 等)
  • - 负载均衡(Load Balancer)
  • - DNS
  • - AutoScaling (services 自动伸缩服务)
  • - Splunk 日志收集
  • - NewRelic 性能监控
  • - Sentry.io 和 PagerDuty 报警
这些基础设施的搭建和配置我们希望将其模板化,自动化。我们才用代码描述基础设施,DevOps 提供工具模板化基础设施的描述。实践:
  • - 采用 AWS 云服务进行部署
  • - 采用 AWS CloudFormation 描述和创建资源
  • - 将对资源操作的脚本进行 source control
准则:
  • - 对资源的描述和操作应该在 git 中
  • - 在所有环境中采用相同的部署流程
  • - 使用 ssh 等手动操作资源的方式,只能用于测试环境和做一些 debug。

共享构建脚本

975e2b6871f6cdf80e77025456766e801db239dc
在为多个 services 搭建 CD pipeline 之后,我们将 CD pipeline 归纳为三部:
  1. 1. 运行测试
  2. 2. 构建发布 docker image
  3. 3. 部署
分别为这三步提取出 shell scripts:
  1. 1. test.sh
  2. 2. docker-tag.sh
  3. 3. deploy <test|prod>

之后为上述脚本创建 git repository,并且将其以 git submodule 的方式引入各个项目。持续部署了之后呢?

让 CD pipeline 服务团队的工作流程

我们搭建好 CD pipeline,需要让它在团队的敏捷开发流程中发挥为威力: f85b85007540fc43aa99d87c427ed8fc779764ad
团队职责:
  • - 团队主要分为 BA,Developer(简称 Dev),Tech Lead(简称TL)
  • - BA 负责分析业务,并在故事墙上创建 Story
  • - Dev 负责开发,QA,运维(跨能型团队)
  • - Tech Lead 负责技术
工作流程:
  1. 1. Dev 从 Backlog 中拿卡进行分析,分析完成后跟 BA,TL一起 kickoff 确定需求、技术实现。
  2. 2. kickoff 之后, Dev 在 repository 上创建 Pull Request(简称 PR) 开始工作。此时在 PR 上的每一次 git push 会触发 PR 的 pipeline,此时在 CI 机器上只会运行单元测试和集成测试。
  3. 3. Dev 开发完成后,其他 Dev 对 PR 进行 Review,Review 通过之后将 PR merge 到 master 分支,此时会 trigger master 分支上的 pipeline,将最新代码自动部署到 test 环境。
  4. 4. 部署 test 环境成功后,Dev 基于 test 环境进行 QA。
  5. 5. QA 完成后向 BA, TL 做 showcase 进行 user acceptance test。
  6. 6. 通过 user acceptance test 之后,在 BuildKite 上点击部署到 production 按钮完成发布。

按照以上流程,团队可以快速从 CI/CD pipeline 上得到反馈,高度自动化的 CD pipeline 可以让团队做到按照 Story 进行 service 发布。Summary

Microsservices 在业务和技术的扩展性方面带来了极大的便利,同时在组织和技术层面带来的极大的挑战。由于在架构的演进过程中,会有很多新服务产生,持续部署是技术层面的挑战之一,追求极致的自动化,可以让团队从基础设施抽离出来,关注与产生业务价值的功能实现。

Q&AQ1:你们的docker是用什么来管理的?k8s,swarm 还是其他什么?

A1: K8S, Swarm 都没使用,对这两个服务我也只是听说过。 每个独立的 service Docker image 会单独运行在 AWS EC 2 Instance。管理一般也都是围绕 EC 2 Instance 来做。关于  Docker Images 仓库,采用自建的 Docker Registry 服务来 push 和 pull docker image。================Q2:如何做跨语言的服务集成A2:  我们做过 Ruby 和 Node.js 的集成。服务器间通信采用 HTTP 协议,JSON 作为传输格式, JSON 基于 hyper media link 的实现之一 HAL 。  如何解决 service 之间的约定,我们采用 Consumer Driven Contract 的方式,使用单元测试代替集成测试,这部分实现采用 Pact 。================Q3:service的粒度如何确定A3: 这是一个非常好的问题,也是很难回答的问题。  我个人觉得 microservices 中最难回答的两个问题是:1. 什么拆分出一个 service?2. 怎么拆分?(也就是拆分多细,系统边界如何确定)service 粒度如何确定,一句话来回答(TL;DR):『采用领域驱动设计(DDD)的方式拆分』。更长版本,我们项目是为客户解决已运行10年以上财务生态系统的拆分问题。也就是老系统改造,也是我觉得最适合实施 micro services 的场景。老系统存在很多痛点,并且需求较为稳定。那么如何拆:1. 需要引入业务专家,技术专家,相关利益人一起分析业务场景,系统构成确定领域语言对业务进行建模。2. 将以前以业务切分系统的思路转为按照数据模型切分的思路。3. 每个类数据模型可以划分多种子模型来辅助主数据模型。4. service 的粒度一般以数据模型的粒度来确认。还有一些按照非功能性需求来切分的原则,比如实施 CQRS 的时候,将读写拆成两部分,采用 Even Sourcing 解决分布式系统数据状态同步的问题。================Q4:为什么没有考虑gocd,gocd可是first class的CI/CD工具A4:  好问题,这个我需要找 ThoughtWorks 负责 GoCD 的同时聊聊销售问题。BTW,我个人还没机会使用过 GoCD================Q5:目前发现从esb  soa转microservice,原本进程内的调用关系变成了网络调用,一次rpc变成了几次或者几十次rpc,同等条件下性能损失严重。这个问题如何得到解决?A5:  好问题,性能问题也是被同事问得最多的问题。关于性能问题我没遇见过高并发的场景,当时对于降低 services 依赖,控制网络请求我们是有一些解决方案。1. 所有 services 基本都部署在同一个网络,比如 AWS 的网络上,可以讲起想想成内部局网,HTTP call 带来的性能损耗目前为止还算可以接受。

2. 从系统设计的角度讲,与其降低HTTP请求的消耗时间,不如减少HTTP 请求的发送次数。从系统设计上考虑,大部数据模型都是 immutable (不可变得),在系统系统间我们将数据缓存,减少 HTTP 请求的次数。

目录
相关文章
|
Prometheus Kubernetes Cloud Native
Argo与Flux在云原生GitOps实践上的能力对比与分析
随着云原生技术的普及和落地,越来越多的云原生应用被部署到生产环境中,由于云原生应用通常都是基于云的分布式部署模式,且每个应用可能是由多个功能组件互相调用来一起提供完整的服务的,每个组件都有自己独立的迭代流程和计划。在这种情况下,功能组件越多,意味着应用的发布管理越复杂,如果没有一个好的方案或者系统来管理复杂应用的发布上线的话,业务面临的风险也是非常大的。开源社区在复杂应用发布管理方面逐渐开始发力,
4204 1
|
11月前
|
敏捷开发 Kubernetes Cloud Native
Web开发者的云原生指南(5)持续集成与持续部署
在本节中,我们将介绍持续集成与持续部署的概念以及与之相关的关键主题。我们将详细探讨构建与测试的自动化、持续集成工具和流程、持续部署工具和流程,以及持续交付和滚动升级的实践。
179 0
|
11月前
|
消息中间件 监控 负载均衡
微服务架构的挑战与解决方案:最佳实践指南
微服务架构在软件开发领域中越来越受到关注和应用。它提供了一种将复杂应用程序拆分为独立可部署服务的方法,每个服务都有自己的职责和功能。尽管微服务架构具有许多优势,但在实施过程中也面临一些挑战。本篇博客文章将介绍微服务架构的挑战,并提供一些解决方案和最佳实践,以帮助开发人员克服这些挑战。
429 0
|
12月前
|
存储 运维 Kubernetes
|
12月前
|
存储 运维 Kubernetes
|
12月前
|
运维 Kubernetes Cloud Native
SREWorks云原生数智运维工程实践-Kubernetes资源编排之二:Helm篇(下)
SREWorks云原生数智运维工程实践-Kubernetes资源编排之二:Helm篇
|
12月前
|
运维 Kubernetes Cloud Native
|
12月前
|
XML 运维 Kubernetes
|
12月前
|
JSON 自然语言处理 Java
「微服务架构」Google和eBay在构建微服务生态系统方面的深刻教训
「微服务架构」Google和eBay在构建微服务生态系统方面的深刻教训
|
运维 Kubernetes Cloud Native
Higress & Kruise Rollout: 渐进式交付为应用发布保驾护航
相比于传统人工手动方式,Higress & Kruise Rollouts提供了无侵入、自动化运维方式让应用发布丝滑般顺畅。
Higress & Kruise Rollout: 渐进式交付为应用发布保驾护航