在性能测试中,需要根据具体的性能需求和系统架构等情况,采用不同的测试策略,其中最常见的策略就有容量测试。这篇文章,就来聊聊容量测试以及容量规划的一些内容。。。
一、什么是容量?如何理解?
在开始之前,有一点需要知道:系统的处理能力是有限的!
1、容量定义
所谓容量,即系统处于最大负载状态或某项指标达到所能接受的最大阈值下对请求的最大处理能力。
2、如何理解
①、系统的容量(处理能力)是有限的;
②、容量是可度量的;
二、如何统计容量指标?
1、统计维度
一般来说,可以从如下两个维度来定量系统的容量:
维度类型 | 列举说明 |
最大负载状态 | 服务器CPU使用率达到100% |
内存使用达到最大值 | |
磁盘IO延时超过所能接受的最大时延 | |
磁盘使用率超过最大限制 | |
网络使用率达到上限(最大吞吐量) | |
最大接受阈值 | 每秒请求数/事务数(QPS/TPS) |
响应时间(ART/99%RT) | |
事务成功率(一般要求99.99%甚至更高) | |
超时/异常错误率 | |
配置参数,比如:最大连接数、最大线程数、JVM内存分配上限 |
2、统计方法
一般来说,常用的采集数据的方法,有以下几种方式:
①、埋点采集:即在系统的各个节点,根据需要添加埋点,针对性的进行数据采集;
②、日志/数据库:通过日志服务(比如ELK)或者运维监控(现在很流行的Devops),采集分析数据;
③、Agent/探针:在需要采集的节点添加Agent/探针,实时采集,数据存入时序数据库(比如influxdb),实时展示;
3、注意事项
①、采集对比的数据一定要采集线上的真实数据,这样才能反映真实客观的系统压力。
②、容量测试环境的配置,一定要和线上保持一致(服务器数量可以不同,但配置尽可能保持一致)。
三、容量测试
容量测试是性能测试里的一种测试方法,它的目的就是测量系统的最大容量,为系统扩容,性能优化提供参考,节省成本投入,提高资源利用率。
1、测试思路
①、根据具体的业务情况和系统架构,通过配置测试的手段,测量得到单个服务节点在对应的业务场景下最大的性能表现;
②、根据系统架构(集群、分布式、微服务)特点,通过启用≥2的服务节点,来得到服务节点的增加和系统性能的提升比例;
③、通过线上采集的系统数据,分析出过去某段时间(或某个业务)的高峰流量,然后通过计算,得到容量扩容,需要投入的实际服务数量;
2、约束/停止条件
在测试过程中,只要限定的某项指标达到最大可接受阈值或某项资源达到最大使用状态,即刻停止测试。
3、选择合适的容量指标
考虑到业务需求和系统架构的不同,在选取容量指标时一般遵循如下原则:
①、数据密集型:即并发请求量较大的类型,一般TPS和RT是比较关注的指标;
②、数据存储型:即需要存储读写的数据量较大的类型,一般吞吐量和IO是比较关注的指标;
四、容量规划
1、为什么需要容量规划?
对于业务越来越复杂的商业形态,每个业务都由一系列不同的系统来提供服务,每个业务系统都部署在不同的机器上。容量规划的目的在于让每一个业务系统能够清晰地知道:
①、什么时候应该增加服务节点,什么时候应该减少服务节点(比如服务端接受到的流量达到什么量级)?(比如双十一,大促,秒杀)
②、为了双 11 、促销、秒杀、渠道拓展引流等业务需求,需要扩充到什么数量级的服务,才能即保证系统的可用性、稳定性,又能节约成本?
2、容量规划四步走
①、业务流量预估阶段:通过分析历史数据以及实时的线上监控,预估未来某个时间点或者某个业务可能会有多少多少的流量冲击;
②、系统容量评估阶段:根据具体的业务场景,分析每个业务场景的流量配比,然后计算每个业务大概需要多少服务节点来提供可靠稳定的性能支撑;
③、系统容量测试阶段:通过全链路压测或者PAT/UAT环境的压测,来模拟真实的业务场景,确定每个服务节点的具体性能表现,进行针对性的调整;
④、流量分配调整阶段:根据压测的结果,设定限流、服务降级等系统保护措施,来预防当实际流量超过系统所能承受的最大流量时,系统无法提供服务;
3、扩容手段
①、垂直扩容
升级服务的硬件配置,让单个服务节点的容量更大,来提供更高的系统服务能力。比如:
加大服务机器的CPU数量和内存,更换性能更好的高速缓存服务器,数据存储用NAS盘替换等。
②、水平扩展
即增加服务节点的数量,让可提供服务的服务变得更多,来提升系统总体的服务能力。常见的方式有:
服务集群:服务器的数量由1→N(但需要重点关注负载均衡);
分布式:提供服务的节点由统一集中管理部署,分散到不同的地点;
容器:提供更灵活的弹性扩容机制,根据具体的访问流量大小来弹性扩容或者缩容;
4、更多参考
关于容量规划,可以看这里:阿里巴巴全链路压测
关于集群和分布式,看这里:分布式与集群的区别是什么?