全链路压测系列文章,写到这里算告一段落,最初萌生写系列文章,还是在21年9月份。兜兜转转写了很久,草稿改过很多次,随着这一年更多的实践和思考,终于算是完结。
这篇文章与其说是全链路压测的SOP,还不如说是对整个系列内容的一个回顾。我希望通过这篇文章,大家对全链路压测整体上有新的认识和理解。
什么是SOP?
所谓SOP,是Standard Operating Procedure三个单词中首字母的大写,即标准作业程序,指将某一事件的标准操作步骤和要求以统一的格式描述出来,用于指导和规范日常的工作。 ——来自百度百科
本篇文章要说的全链路压测SOP,实际上就是我在实践全链路压测的过程中,对实践经验和教训的一个总结。
SOP思维导图
SOP的目的
从实践经验的角度出发,生产全链路压测在技术实现上没有太多新花样,但要在不同的业务和企业落地,就各有各的实践路径。对于没有太多经验的同学来说,全链路压测的落地,大多还是基于个人的经验和熟悉的领域,即都是在局部作战,缺乏全局的视角和可视化地图。从全局来讲,缺少适用于自己的全链路压测最佳实践。
写这篇全链路压测SOP的目的,主要是基于如下几点因素考量:
- 阐述我对生产全链路压测的一些思考和认知;
- 提供一个全链路压测从零开始落地的实践路径;
- 提出落地过程遇到的问题和背后原因及我是如何解决的;
系列文章回顾
再加上本篇的生产全链路压测SOP思维导图,就是整个系列的内容。
大家在实践过程中,可以在不同阶段参考上述文章中的内容,看看我是如何做的,遇到了什么问题以及如何解决的。最后,重申一下我对全链路压测的部分认知:
- 全链路压测是一个技术工程,而非单纯的测试手段;
- 全链路压测只适用于部分企业和业务类型,而非一个银弹;
- 全链路压测的落地并非一蹴而就,需要较好的技术基础设施建设做保障;
- 落地全链路压测最大的挑战不是技术能力,而是企业的组织协调和沟通效率;
- 全链路压测的本质是尽量用较低的成本确保系统稳定可用,以保障系统在峰值流量下支撑业务目标达成;