关于10万并发压测时弹性扩容失效问题回答

本文涉及的产品
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
性能测试 PTS,5000VUM额度
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: 关于10万并发压测时弹性扩容失效问题回答

之前压测过2万用户在30秒内每个用户每秒5次请求,OPS大概在3千左右,但是弹性伸缩虽然在扩容预期值的时候很给力,也能将新加的服务器添加到负载均衡中,但是当cpu使用率超过80%的时候,我其实是有配置报警任务的,当超过这个阀值时,让它添加一台服务器,可惜没生效。

具体场景可以查看前面的文章:

jemeter压测【2万用户每秒5次请求在30秒内处理完请求】

【红包雨功能的】环境部署(弹性伸缩、负载均衡、Redis读写分离、云服务器部署)

给出解答:

报警任务在触发伸缩规则时受伸缩规则冷却时间影响,伸缩规则在冷却时间内时,会拒绝执行伸缩规则。伸缩组内新增加的ECS实例或ECI实例从加入伸缩组到完成系统启动配置,部署您的业务,获取到监控数据需要一定的时间(通常需要几分钟)。报警任务会受冷却时间的影响,即便你配置的冷却时间很短,但启动新的服务器到部署你的业务仍然需要花费几分钟的时间,这个时间是无法避免的。

举个例子:2万用户在30秒内每个用户每秒5次请求,报警任务超过80%添加一台服务器,冷却时间是10秒,10后如果cpu使用率还是超过80%,继续添加1台服务器,以此类推。由于压测时间只有30秒,ECS实例开机都是分钟级,从开启一台新服务器到后面部署业务运行需要几分钟,所以伸缩无法扩容。而且如果后期压测时间缩短到10秒内,那么就更加无法弹性扩容了。

如果说现在只是想测弹性伸缩且不要求秒级扩容,也可以不用那么麻烦,先按照目标追踪规则来配置,直接弹ECS也是可行的,通常而言,并发也是慢慢的上去的,很少会突然爆。只不过考虑到红包雨这种业务场景,像过年的那种春节红包,10秒以内用户疯狂点击,还是需要做到秒级扩容的。

解决方案有3种:


一种是直接预估峰值,配置多台ECS服务器,由于时间短,造成的资源浪费还算能承受。


一种是可以考虑用ECI,这个是专门针k8s设计的容器实例,需要本身业务是可以支持容器化的,非常适合弹性部分的业务 ,文档链接:https://help.aliyun.com/zh/eci/getting-started/use-elastic-container-instances?spm=a2c4g.750001.0.i1


一种是直接用阿里云的ack服务,就是master节点由阿里云托管,我那边只管理worker节点。稳态业务用ECS+ACK比较适合,这个两种方案:

  • ACK+ECS,通过ACK在ECS上创建多个node节点,在node创建多个pod节点,
  • ACK severless+ECI,直接创建ECI实例,在上面创建多个pod环境

文档链接:https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/product-overview/what-is-ack

如果文档看不懂,没关系,有视频可以看:

https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/getting-started/getting-started-with-ack-using-the-ack-console?spm=a2c4g.11186623.0.0.14b83c62EQBH7Z#a8474b9017txc

操作步骤:

默认即可

默认即可

根据提示给予授权

然后就会有短信提示


相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
6月前
|
监控 供应链 测试技术
PTS压测问题之自动变成500 并发如何解决
PTS(Performance Testing Service)是一项面向网站、应用等提供的压力测试服务,用于模拟不同场景下的用户访问,评估系统的性能表现;在进行PTS压测时,可能会出现一些异常或报错,本合集将PTS压测中频繁出现的问题及其解决办法进行汇编,旨在帮助用户更有效地进行性能测试和问题定位。
399 2
|
6月前
|
消息中间件 监控 关系型数据库
PTS压测问题之多账号并发登录配置如何解决
PTS(Performance Testing Service)是一项面向网站、应用等提供的压力测试服务,用于模拟不同场景下的用户访问,评估系统的性能表现;在进行PTS压测时,可能会出现一些异常或报错,本合集将PTS压测中频繁出现的问题及其解决办法进行汇编,旨在帮助用户更有效地进行性能测试和问题定位。
297 2
|
消息中间件 缓存 NoSQL
【红包雨压测】提供2万用户30秒内5次请求的并发服务支持
【红包雨压测】提供2万用户30秒内5次请求的并发服务支持
166 0
|
测试技术 数据库
接口并发性能测试开发之:从测试方案设计、测试策略、指标分析到代码编写,这一篇全搞定。
接口并发性能测试开发之:从测试方案设计、测试策略、指标分析到代码编写,这一篇全搞定。
342 0
|
测试技术
性能测试(21)——常用平均并发数计算公式
PV:(Page View):即页面访问量,每打开一次页面PV计数+1,刷新页面也是。PV只统计页面访问次数。 UV(Unique Visitor):唯一访问用户数,用来衡量真实访问网站的用户数量。 一般用UV统计用户活跃数,用PV统计用户访问页面的频率
987 0
性能测试(21)——常用平均并发数计算公式
|
测试技术 数据库 云计算
性能测试中如何确定并发用户数
性能测试中如何确定并发用户数 近日,Hitest在其技术博客上发表了一篇题为 《并发用户数与TPS之间的关系》的文章,文章对TPS和并发用户数做了详细的解释,并针对性能测试中系统性能的衡量维度和测试策略给出了自己的建议。Hitest是阿里巴巴技术质量部提供的一款Web&移动应用安全测试SaaS化服务平台,旨在帮助开发者简单快捷地进行安全测试。
|
关系型数据库 MySQL 测试技术
【性能测试】三、TPS 和并发数是什么关系?
【性能测试】三、TPS 和并发数是什么关系?
【性能测试】三、TPS 和并发数是什么关系?
|
监控 Shell 测试技术
大话JMeter4|不同的并发数可以自动化做压测吗?
![](https://ceshiren.com/uploads/default/original/3X/2/a/2a554254fc8bc1b0940a66a733efe448359a0ec3.jpeg) 上节课爱画漫画的小哥哥用漫画形式向大家展示了JMeter的进阶用法:如何搭建InfluxDB,使用更炫酷的Grafana。 看到很多小伙伴觉得看的不过瘾,在强烈的催促下,小哥哥的新文章又出
|
测试技术
Postman - 压测模拟并发
Postman - 压测模拟并发
421 0
Postman - 压测模拟并发