全链路压测(14):生产全链路压测SOP

简介: 从实践经验的角度出发,生产全链路压测在技术实现上没有太多新花样,但要在不同的业务和企业落地,就各有各的实践路径。对于没有太多经验的同学来说,全链路压测的落地,大多还是基于个人的经验和熟悉的领域,即都是在局部作战,缺乏全局的视角和可视化地图。从全局来讲,缺少适用于自己的全链路压测最佳实践。

全链路压测系列文章,写到这里算告一段落,最初萌生写系列文章,还是在21年9月份。兜兜转转写了很久,草稿改过很多次,随着这一年更多的实践和思考,终于算是完结。

这篇文章与其说是全链路压测的SOP,还不如说是对整个系列内容的一个回顾。我希望通过这篇文章,大家对全链路压测整体上有新的认识和理解。


什么是SOP?


所谓SOP,是Standard Operating Procedure三个单词中首字母的大写,即标准作业程序,指将某一事件的标准操作步骤和要求以统一的格式描述出来,用于指导和规范日常的工作。              ——来自百度百科


本篇文章要说的全链路压测SOP,实际上就是我在实践全链路压测的过程中,对实践经验和教训的一个总结。


SOP思维导图


640.png


SOP的目的


从实践经验的角度出发,生产全链路压测在技术实现上没有太多新花样,但要在不同的业务和企业落地,就各有各的实践路径。对于没有太多经验的同学来说,全链路压测的落地,大多还是基于个人的经验和熟悉的领域,即都是在局部作战,缺乏全局的视角和可视化地图。从全局来讲,缺少适用于自己的全链路压测最佳实践。


写这篇全链路压测SOP的目的,主要是基于如下几点因素考量:


  1. 阐述我对生产全链路压测的一些思考和认知;
  2. 提供一个全链路压测从零开始落地的实践路径;
  3. 提出落地过程遇到的问题和背后原因及我是如何解决的;


系列文章回顾


全链路压测(1):认识全链路压测

全链路压测(2):方案调研和项目立项

全链路压测(3):技术改造和测试验证

全链路压测(4):全链路压测的价值是什么?

全链路压测(5):生产全链路压测实施全流程

全链路压测(6):确认范围和识别风险

全链路压测(7):核心链路四问

全链路压测(8):构建三大模型

全链路压测(9):容量评估和容量规划

全链路压测(10):测试要做的准备工作

全链路压测(11):聊聊稳定性预案

全链路压测(12):生产压测必不可少的环节

全链路压测(13):高可用和性能优化

再加上本篇的生产全链路压测SOP思维导图,就是整个系列的内容。


大家在实践过程中,可以在不同阶段参考上述文章中的内容,看看我是如何做的,遇到了什么问题以及如何解决的。最后,重申一下我对全链路压测的部分认知:


  1. 全链路压测是一个技术工程,而非单纯的测试手段;
  2. 全链路压测只适用于部分企业和业务类型,而非一个银弹;
  3. 全链路压测的落地并非一蹴而就,需要较好的技术基础设施建设做保障;
  4. 落地全链路压测最大的挑战不是技术能力,而是企业的组织协调和沟通效率;
  5. 全链路压测的本质是尽量用较低的成本确保系统稳定可用,以保障系统在峰值流量下支撑业务目标达成;
相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
11月前
|
监控 测试技术 UED
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(1)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(1)
196 0
|
11月前
|
域名解析 网络协议 数据可视化
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(2)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(2)
151 0
|
11月前
|
SQL 监控 关系型数据库
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(3)
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.3 平台网站业务稳定性保障——5.3.2 全链路压测与容量评估(3)
143 0
|
存储 SQL 缓存
全链路压测(13):高可用和性能优化
业务场景复杂化、海量数据冲击下,发现并解决业务系统的可用性、扩展性以及容错性问题。
全链路压测(13):高可用和性能优化
|
监控 Java 测试技术
全链路压测(12):生产压测必不可少的环节
在生产环境开展全链路压测,相对于测试环境来说风险和成本都是比较大的。因此需要一套严格的流程管控和响应机制,以及高效的团队协同体系。
全链路压测(12):生产压测必不可少的环节
|
缓存 监控 安全
全链路压测(11):聊聊稳定性预案
从业务角度来讲,无论技术做任何的改动和优化,最终的目的都是为了业务目标的达成。而系统的稳定性,无论从用户体验还是业务目标达成的角度来看,都是不可忽视的一环。
|
SQL 缓存 运维
全链路压测(10):测试要做的准备工作
功能验证环境即用来验证技术组件本身的功能正确性和接入性能损耗的环境,有独立的随时可用的环境最好。如果考虑到成本,也可以用线下性能环境来进行验证。
全链路压测(10):测试要做的准备工作
|
运维 监控 安全
全链路压测(9):容量评估和容量规划
容量评估我在之前的文章《性能测试从零开始实施指南——容量评估篇》中已做过详细介绍,这里不多做赘述。关于容量评估,参考下面两张思维导图,更容易理解。
全链路压测(9):容量评估和容量规划
|
缓存 监控 NoSQL
全链路压测(8):构建三大模型
单机单接口的压测,可以通过梯度增加请求的方式,观察随着请求的增加,其性能表现&资源损耗的变化。在目前的微服务架构下,整体链路的性能瓶颈,取决于短板(木桶原理)。因此,单机单链路基准测试的目的,是在全链路压测开始前进行性能摸底,定位排查链路瓶颈。
全链路压测(8):构建三大模型
|
容灾 中间件 测试技术
全链路压测(7):核心链路四问
很多企业都会有自己核心的业务范围,这些核心业务也往往是主要的企业利润来源。以电商企业为例,为用户提供商品的购买服务,为商家提供商品的管理和上架及定价展示,利润大多为撮合用户和商家交易所带来的服务费以及广告等相关费用。
全链路压测(7):核心链路四问