《云上业务稳定性保障实践白皮书》——四. 变更管控体系——4.2 变更管控动作——4.2.2灰度

简介: 《云上业务稳定性保障实践白皮书》——四. 变更管控体系——4.2 变更管控动作——4.2.2灰度

4.2.2灰度


灰度为变更提供一种快速低成本的试错机制,其具有多种不同层面的实现形式。一种典型的灰度机制,是提供一套完整而独立的测试环境,用于正式生产变更前的提前验证。另一种较为典型的灰度机制,为在生产环境分批次变更,通过细化控制变更的节奏和影响范围,实现小规模生产试错能力。


image.png


测试环境(SPE)


灰度测试环境的目的是隔离生产流量,减少风险影响,在环境内形成调用闭环,方便测试。测试环境灰度的时间点位一定要在上线生产之前。可引流内网全部流量和线上1%流量作为测试覆盖的基础。


生产灰度分批


这里列举三个常见的分批方式:簇内分批、簇间串行、簇间打散,每个层面中对应的灰度方式如下图所示:


image.png


图中的簇指的是可以继续拆分的逻辑组,包含但不限于单元、Region、机房、

Availability Zone、VPC、Cluster、分组、自定义逻辑区域等。


线上生产环境灰度变更建议包含以下要求:可分批、可控制分批间隔、可观测/可验证、可暂停/可回滚。


•可分批:指灰度方式必须至少满足灰度分批方式中的一项:簇内分批、簇间串行、簇间打散。确定好灰度方式后,至少需要2批进行发布。如果确实不具备灰度能力,建议提升审批申报层级。


可控制间隔:指变更可对每批次的发布时间间隔进行控制。


•可观测:指变更系统每批次发完后,需要观测并验证本批次发布无问题后才能进行下一批次的发布。观测和验证的手段包括但不限于以下方式:在变更系统里至少记录一项核心反应健康状态的指标(业务监控项、日志文件名等)或记录double check人员或采用自动化观测等,并能通过对线上文件验证等方式确定已发布成功。


•可回滚:指灰度时需具备分批回滚、全量回滚的能力,回滚单要有变更记录并可追溯。

相关文章
|
3月前
|
人工智能 安全 机器人
瞭望塔丨见真章,定未来:2026 年 AI 趋势展望
为企业提供一份兼具前瞻性与实操性的 2026 年行动参考
|
6月前
|
存储 Kubernetes 应用服务中间件
容器服务ACK入门:Kubernetes上云实践
本文介绍阿里云容器服务ACK(Kubernetes)上云实践,涵盖集群创建、工作负载部署、服务暴露、存储管理与监控运维。通过实战示例,帮助用户快速掌握ACK核心功能及微服务部署全流程。
1021 0
|
9月前
|
前端开发 JavaScript NoSQL
比分网开发技术栈与功能详解
本项目介绍了一个比分网的核心功能模块和技术实现方案。功能涵盖首页总览、比赛详情、赛事导航、新闻资讯及用户系统等。技术上,前端采用Vue.js或React实现响应式设计,后端使用Node.js或Python处理高并发请求,结合Redis缓存实时数据,WebSocket实现实时推送。推荐使用第三方体育数据API获取稳定数据源,同时强调了架构扩展性、数据准确性及版权问题的重要性。适合个人或小团队快速搭建专业比分平台。
|
机器学习/深度学习 数据采集 人工智能
人工智能在变更管理中的应用:变革的智能化之路
人工智能在变更管理中的应用:变革的智能化之路
713 13
|
算法 Python
逆袭之路!用 Python 玩转图的 DFS 与 BFS,让数据结构难题无处遁形
【7月更文挑战第12天】图的遍历利器:DFS 和 BFS。Python 中,图可表示为邻接表或矩阵。DFS 沿路径深入,回溯时遍历所有可达顶点,适合找路径和环。BFS 层次遍历,先近后远,解决最短路径问题。两者在迷宫、网络路由等场景各显神通。通过练习,掌握这些算法,图处理将游刃有余。
373 3
|
存储 运维 监控
蚂蚁超大规模分布式系统稳定性体系实践
大规模分布式系统的稳定性建设,是确保业务服务不受硬件、人为等风险因素影响而中断的核心工作,随着业务规模增大和复杂度的提升,系统稳定性的重要程度和难度也随之增大。在蚂蚁集团业务发展过程中,业务复杂度、用户规模以及业务重要性都逐步增大,相应的稳定性建设也伴随着业务的发展进行了不断地建设和提升。
3125 1
蚂蚁超大规模分布式系统稳定性体系实践
|
存储 缓存 分布式计算
【大数据】计算引擎MapReduce
【大数据】计算引擎MapReduce
746 0
如何设计可靠的灰度方案
一个较大的业务或系统改动,往往会影响整个产品的用户体验或操作流程。为了控制影响面,可以选取一批特定用户、流程、单据等,只允许这一部分用户或数据按照变更后的新逻辑在系统中流转,而另一部分用户仍然执行变更前的老逻辑。这一步是线上系统灰度方案的起点。
如何设计可靠的灰度方案
|
存储 文件存储 UED
阿里云网盘和个人版阿里云盘的主要区别
【1月更文挑战第5天】【1月更文挑战第24篇】阿里云网盘和个人版阿里云盘的主要区别
2012 1

热门文章

最新文章