作者：拂衣

PTS 简介

性能测试 PTS（Performance Testing Service）是阿里云上一款简单易用，具备强大的分布式压测能力的 SaaS 压测平台。PTS 可以模拟复杂的业务场景，并快速精准地调度不同规模的流量，同时提供压测过程中多维度的监控指标和日志记录。用户无需准备资源，即可按需发起压测任务，监控压测指标，获取压测报告，进而能够高效率、全方位地验证业务站点的性能、容量和稳定性。

阿里云压测平台演进之路

阿里云压测平台 PTS，由阿里云可观测团队倾心打造，应双十一稳定性和容量规划的需求背景而诞生，随高可用、中间件上云而对外输出产品能力。整体演进分以下 5 个阶段：

2010 年-阿里巴巴容量规划平台

在此之前，阿里巴巴大促活动的容量规划主要通过人工估算的方式来完成的。各个系统的负责同学聚在一起开个会，将信息汇总到一起，按专家经验就把容量规划的机器预算给定下来了。而且，各个系统通常都留了比较大的机器冗余，即使估算的不准也不会造成大的业务影响。

此时，容量计算的公式被第一次提了出来，通过目标容量/单机容量上限，得到各应用需要的机器资源数，再加上一定比例的冗余量，就是大促时需要的总资源数。

在阿里容量规划平台的 1.0 版本当中，通过对各业务系统线下环境单机压测，来获取各服务的单机容量上限，完成了从人工容量规划到系统化容量规划的过度。

2013 年-阿里巴巴全链路压测-流量平台

随着双十一业务规模快速拉升，分布式系统架构的技术组件越来越多，应用的上下游依赖关系也越来越复杂。双十一当天 0 点到来的时候，从 CDN 到接入层、前端应用、后端服务、缓存、存储、中间件整个链路上都面临着巨大流量，这个时候应用的服务状态除了受自身影响，还会受到依赖环境影响，并且影响面会继续传递到上游，哪怕一个环节出现一点误差，误差在上下游经过几层累积后会造成什么影响谁都无法确定。由于各层依赖的不确定性，无法再基于单业务容量上限规划全局容量。

所以我们建立了全链路压测机制，通过全面仿真双十一业务流量，我们的系统能够提前经历几次“双十一”，让容量的不确定性问题提前暴露并解决。

流量平台是全链路压测的 CPU，能够模拟出双十一上亿用户的仿真流量，制造每秒数十万次用户行为的超大规模流量。主要由两大部件构成：1）全链路压测操控中心，进行压测的配置和操控、数据的监控以及对压测引擎集群的管控；2）压测引擎，由控制台统一管控，部署在外网 cdn 集群，进行登陆、session 同步，发送各种协议的压测请求、状态统计。

2013 年之后，全链路压测成为双十一、双十二等大促备战最重要的稳定性验证工具，随着业务的发展不断进化，持续发挥着不可替代的作用。

2018 年-阿里云 PTS 1.0：阿里云压测产品发布

在云计算的浪潮下，越来越多的用户开始基于阿里云上的基础产品设计自己的架构。在 2018 年，我们正式发布了阿里云压测产品：PTS，将阿里巴巴集团压测平台的技术架构迁移至阿里云，对外部用户提供 SaaS 化的压测产品。PTS 1.0 核心能力包括：

无限接近真实的流量：业务场景中无论是高并发要求还是发起端的分散度，覆盖三四线城市主要运营商的节点广度都能做到真正模拟用户行为，客户端到服务端间复杂的网络瓶颈也能暴露无遗，压测结果更加全面和真实可信。
操作简单易上手：不需要专门的性能测试团队或者测试背景的积累，完全面向开发的交互设计，开发自测试，投入产出比高。
多维度施压：支持并发和 RPS 双维度。
压力动态调整：支持压测能力动态修改。

2020 年-阿里云 PTS 2.0：施压能力、产品体验再升级

随着 PTS 1.0 用户规模的不断扩大，越来越多的用户在不同的业务场景对 PTS 提出了支持超高并发的压测需求，甚至超过了集团双十一的并发量级，典型场景如：春晚红包压测、保险开门红压测、考试报名压测等。PTS 2.0 通过优化资源调度和施压引擎性能，提供了百万并发、千万 QPS 的压测能力，连续支撑了多次春晚红包活动等顶级流量压测。

同时，PTS 2.0 升级了流量录制和多协议场景化功能，提升了产品体验：