CTO 点名要搞个灰度发布系统,不慌!

简介: 互联网产品需要快速迭代开发上线,又要保证质量,保证刚上线的系统,一旦出现问题可以很快控制影响面,就需要设计一套灰度发布系统。

灰度发布的定义

互联网产品需要快速迭代开发上线,又要保证质量,保证刚上线的系统,一旦出现问题可以很快控制影响面,就需要设计一套灰度发布系统。

灰度发布系统的作用,可以根据配置,将用户的流量导到新上线的系统上,来快速验证新的功能,而一旦出现问题,也可以马上的修复,简单的说,就是一套A/B Test系统。

灰度发布允许带着bug上线,只要bug不是致命的,当然这个bug是不知道的情况下,如果知道就要很快的改掉

简单灰度发布系统的设计

image.png

灰度简单架构如上图所示,其中的必要组件如下:

1、策略的配置平台,存放灰度的策略

2、灰度功能的执行程序

3、注册中心,注册的服务携带ip/Port/name/version

有了上面三个组件,才算一个完整的灰度平台

灰度的策略

灰度必须要有灰度策略,灰度策略常见的方式有以下几种

1、基于Request Header进行流量切分

2、基于Cookie进行流量切分

3、基于请求参数进行流量切分

举例:根据请求中携带的用户uid进行取模,灰度的范围是百分之一,那么uid取模的范围就是100,模是0访问新版服务,模是1~99的访问老版服务。

灰度发布策略分为两类,单策略和组合策略

单策略:比如按照用户的uid、token、ip进行取模

组合策略:多个服务同时灰度,比如我有A/B/C三个服务,需要同时对A和C进行灰度,但是B不需要灰度,这个时候就需要一个tag字段,具体实现在下文详述

灰度发布具体的执行控制

在上面的简单灰度发布系统架构中我们了解到,灰度发布服务分为上游和下游服务,上游服务是具体的执行灰度策略的程序,这个服务可以是nginx,也可以是微服务架构中的网关层/业务逻辑层,下面我们就来分析一下不同的上游服务,如何落地

Nginx

如果上游服务是nginx,那么就需要nginx通过Lua扩展nginx实现灰度策略的配置和转发,因为nginx本身并不具备灰度策略的执行

通过lua扩展实现了灰度策略的执行,但是问题又来了,nginx本身并不具备接收配置管理平台的灰度策略,这个时候应该怎么办呢?

解决方案:本地部署Agent(需要自己开发),接收服务配置管理平台下发的灰度策略,更新nginx配置,优雅重启Nginx服务

网关层/业务逻辑层/数据访问层

只需要集成配置管理平台客户端SDK,接收服务配置管理平台下发的灰度策略,在通过集成的SDK进行灰度策略的执行即可

灰度发布复杂场景

下面举例两个稍微复杂的灰度发布场景,灰度策略假设都按照uid取模灰度百分之一的用户,看一下如何实现。

场景1:调用链上同时灰度多个服务

功能升级涉及到多个服务变动,网关层和数据访问层灰度,业务逻辑层不变,这个时候应该如何进行灰度?

解决方案:

经过新版本网关层的请求,全部打上tag T,在业务逻辑层根据tag T进行转发, 标记Tag T的请求全部转发到新版数据访问层服务上,没有tag T的请求全部转发到老版数据访问层上。

image.png

场景2:涉及数据的灰度服务

涉及到数据的灰度服务,一定会使用到数据库,使用到数据库就会涉及到你使用数据库前后的表字段不一致,我老版本是A/B/C三个字段,新版本是A/B/C/D四个字段。这时新版的灰度,就不能往老版的数据库进行修改了,这个时候就需要把数据copy一份出来做这个事情了

数据库其实并没有灰度的概念,这个时候我们只能把数据重新拷贝一份出来进行读和写,因为这时你的写必须是全量的(双写),不能说90%的数据写入到老版本,10%的数据写入到新版本,因为这个时候你会发现两个数据库的数据都不是全量的。

离线全量复制数据的过程中一定会有数据丢失,这个时候就需要业务逻辑层写一份数据到MQ中,等数据同步完成之后,新版的数据访问层再将MQ的数据写入到新版本的DB中,实现数据的一致性,这个也是引入MQ的主要目的。

image.png灰度发布系统架构设计

灰度过程中需要对两个数据库的数据进行对比,观察数据是否一致。这样不管是灰度失败,放弃新版DB,还是灰度成功切换到新版DB,数据都不会产生丢失。

相关文章
|
运维 数据可视化 搜索推荐
CTO来分享:当项目对我下了手!怎么管理项目不会乱?
管理项目,最怕遇到什么情况? 哪怕是工作了十年的职场人员,在面对以下场景时,估计也会一时语塞或毫无思路。 做外包开发的,被客户问到:这个系统能做吗?需要多久时间?费用多少? 做内部业务系统的,被需求问到:这个需求很急很急很急!什么时候可以上线使用? 做互联网产品的,被产品总监指责到:这个需求很简单!怎么实现我不管!今晚必须上线!
|
开发框架 Java 测试技术
【测试基础】五、这样提bug单,开发小哥还会怼你么?
【测试基础】五、这样提bug单,开发小哥还会怼你么?
【测试基础】五、这样提bug单,开发小哥还会怼你么?
|
存储 缓存 监控
最近线上发生的两个坑爹锅!
最近由于在技改,发生了不少问题,前文中说的缓存穿透只是其中之一,想了想,虽然都是比较简单的问题,但是应该实际中还是有不少人碰到过,这些问题看似很简单,但是你绝对应该踩过。
最近线上发生的两个坑爹锅!
|
开发者
阿里云&博客园联合征文——《我修复的印象最深的一个bug》
参与征文活动,领取精美好礼,赶快来分享你的故事吧
13320 0
阿里云&博客园联合征文——《我修复的印象最深的一个bug》
|
Java 数据库连接 测试技术
来咯来咯!2021年,开发者对SpringBoot中实现约束验证,你懂得多少|牛气冲天新年征文
来咯来咯!2021年,开发者对SpringBoot中实现约束验证,你懂得多少|牛气冲天新年征文
130 0
赛博朋克首发Bug多,CDPR:旅程刚开始,已着手更新修复
赛博朋克首发Bug多,CDPR:旅程刚开始,已着手更新修复
314 0
赛博朋克首发Bug多,CDPR:旅程刚开始,已着手更新修复
|
程序员
程序猿最爱说的假话,你中枪了么?(测测你是哪种类型的谎话精)
你还没参加程序员“真”心话接龙挑战? 部门同事都试过啦, 就差你了! 猜猜看,你们会不会集齐所有类型,召唤神龙呢?
1058 0
程序猿最爱说的假话,你中枪了么?(测测你是哪种类型的谎话精)
|
测试技术 C# 图形学
项目交接杂谈
今天笔者和大家聊一聊在项目交接中遇到的问题 项目交接这种事是不可避免的,一个完整、完善的项目在交接的时候会省不少心,反之就让人抓狂了,尤其是代码交接部分,先不说代码是否写的巧妙,只要命名符合规范,思路清晰,有完善的文档,后续的维护是很轻松的,但是那种想起哪里写哪里,毫无逻辑可言的工程就像一坨屎(虽然笔者写的也自认为是屎),所以接手这种工程,再继续维护就好像:在一坨奇臭无比的一坨屎里面分析、分类、挑选这个人昨天都吃了什么,所以为了尽可能的避免这种狗屎工程,笔者谈一谈在交接的时候交接人需要准备的东西。
1725 0
|
IDE 开发工具