通过报警任务和云监控创建弹性伸缩方案-介绍|学习笔记

本文涉及的产品
RDS AI 助手,专业版
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
简介: 快速学习通过报警任务和云监控创建弹性伸缩方案-介绍

开发者学堂课程【根据业务量弹性使用云资源通过报警任务和云监控创建弹性伸缩方案-介绍】学习笔记,与课程紧密联系,让用户快速学习知识。  

课程地址:https://developer.aliyun.com/learning/course/509/detail/6816


通过报警任务和云监控创建弹性伸缩方案-介绍

 

在方案一中介绍创建伸缩组,伸缩配置,启动伸缩组,成一个极简的伸缩方案。

图片1.png

在这里面可以手动添加 ecs 实例来触发相应的伸缩活动。这是方案一中介绍的内容。

在方案二中介绍如何去创建伸缩规则,通过执行伸缩规则去触发相应的伸缩活动

在方案三中,给大家介绍如何去创建定时或者报警任务,通过定时报警任务的设置触发相应的伸缩活动,就是说如何开启弹性伸缩的定时模式和动态模式。

图片2.png

首先是定时任务的创建,定时任务创建首先需要任务名称和任务描述,接下来就是执行时间,比如说在设置时间点,定时任务就被触发。定时任务触发需要根据一定的伸缩规则。

伸缩规则是在伸缩组下设定的,需要先选择相应的伸缩组,然后选择伸缩规则。到了定时的点时候,是要增加还是减少,到底是要执行添加这个 ecs 实例数是多少?

要根据伸缩规则来执行,重试过期时间主要作用就是当这个定时任务被触发的时候,有可能有其他的伸缩活动在执行。这时候定时任务就不能触发,他会有一个重试的时间,如果在这个重试的时间之内,之前的伸缩活动一结束,那么这个定时任务被执行,那如果在重试过期时间之内,之前的活动仍然没有结束的话,当前的定时任务被拒绝掉。说到定时任务从到指定的时间点触发之外,设置这个重复周期的,这个重复周期可以按日,按天执行一次。

前面说每天到12点到时候游戏平台需要增加一些服务器去满足更多用户的访问。另外就是重复周期就是重复结束时间的。可能在一个月之内创建定时任务,每到12:00的时候增加十台服务器去响应这个访问的请求,当然在一个月之后,这个量其实会增加的。所以这个定时任务是有一个重复结束时间的。前面提到一个重试过期时间,这里来看一下执行的一个简单的流程

图片3.png

每个用户可以创建20个定时任务,有多个定时任务出发的时候,会选择最早创建的定时任务,那么这个定时任务被选中之后,这个定时任务也不会被立即被执行,它会判断一下当前伸缩组内是否其他的伸缩活动,如果没有其他伸缩活动,这个伸缩组是正常启用的状态,那么这个定时任务能被执行,那这时候如果有其他活动,这时候会用到重试过期时间,如果它在过期时间之内,那么它会自动的去进行重试。那么它在时间之内重试活动结束了,它就可以去执行,如果超过重试过期时间的话,那么这个定时任务,这个请求拒绝掉。这是定时任务执行的一个简单流程。

接下来是报警任务,除了可以设置定点触发相应的活动,另外可以动态的云监控报警来触发相应的活动,首先是任务名称,描述,接下来设置监控资源,那么这个监控资源监控伸缩组,伸缩组内的监控项得到伸缩组内的 CPU,判断 CPU 的使用率,这里有一个统计周期,一般统计周期设置力度越小,它的触发报警机制就越敏感,通常会根据业务的实际需求去设置统计周期,另外一个统计的办法,通过平均值大于多少去触发这个报警,还有就是可能系统时间段有一些抖动,那么可以通过重复几次报警阈值去确定,比如说三次之后,确定时间段内确实是服务器的资源被占用的比较多,这时候可以去触发相应的规则,前面选择伸缩组,可以直接选择相应的伸缩规则,这是一个报警任务创建的过程。

前面也说了在方案一中添加或减少 ecs 这种方式来触发 ecs 伸缩活动。

那么在方案二中通过配置伸缩规则来触发伸缩活动,在方案三中定时任务或报警任务来触发这个伸缩规则。弹性伸缩的伸缩活动到底是如何执行的?

图片4.png

首先是自动扩展的流程,去增加 ecs 实例是怎么执行的?首先判断伸缩组的健康状态和边界条件,比如说扩张当前的大的实例数是五,如果请求已经超过边界条件就不会去执行,没有超过这个边界条件的会分配相应的活动IP并且执行伸缩活动,到时候要根据伸缩配置创建 ecs  实例,然后修改伸缩组类的实例数,对创建 ecs 实例你分配相应的IP

如果伸缩组内有 rds 实例的时候,创建实例的IP添加到 rds 白名单中,然后等待 ecs 完成,最后如果说有负载均衡,同样也会把 ecs 加到负载均衡的后端服务器里面去,整个 ecs 被加入完成之后,伸缩活动完成,会启动一个冷却时间,这就是一个自动扩展的流程。其实弹性伸缩要根据伸缩配置来自动扩展,其实也可以手动添加现有的 ecs 实例,会在现有的判断 ecs 实例会在之前判断一下现有的 ecs 实例伸缩配置是否一致?

如果一致就被加入到伸缩组里面来 这里没有创建 ecs 实例,同样加起来修改一下当前的伸缩组内 ecs 实例数,同样的这个伸缩组内有 rds 负载均衡,还会把加入到相应的实例当中去,最后是完成伸缩活动启动冷却时间,对于自动伸缩伸缩活动流程来说首先是判断伸缩组的健康状态,它的边界条件,弹性伸缩时最小的实例数,然后会分配活动IP执行伸缩活动,首先把负载均衡中移除,然后停止 ecs  ,然后在 rds  白名单移除,最后释放,更改当前组内的 ecs 实例数,这个自动收缩的流程,手动移除也会判断一下边界条件,然后分配相应的活动 ID,也是首先从负载均衡中移除,然后停止从 rds 白名单移除,但如果手动添加 ecs ,这里就不会有释放 ecs ,最后修改当前伸缩组内的 ecs 实例数,最后同样也是伸缩活动完成,启动冷却时间。

相关文章
|
7月前
|
机器学习/深度学习 人工智能 运维
运维告警别乱飞了!AI智能报警案例解析
运维告警别乱飞了!AI智能报警案例解析
733 0
|
存储 弹性计算 调度
基于Knative的LLM推理场景弹性伸缩方案
Knative的基于请求弹性配置与大语言模型(LLM)的推理场景高度契合。此外,它的资源降配特性可以显著帮助用户降低成本。本文详细介绍基于 Knative 的 LLM 推理场景弹性伸缩方案。
|
弹性计算 缓存 Kubernetes
异步任务处理系统问题之任务执行子系统实现资源的弹性伸缩的问题如何解决
异步任务处理系统问题之任务执行子系统实现资源的弹性伸缩的问题如何解决
192 2
|
弹性计算 监控 开发者
通过报警任务和云监控创建弹性伸缩方案-操作演示|学习笔记
快速学习通过报警任务和云监控创建弹性伸缩方案-操作演示
通过报警任务和云监控创建弹性伸缩方案-操作演示|学习笔记
|
运维 监控 物联网
通过云监控(CMS)报警回调实现云服务器报警信息的语音播报
本文介绍了获取云监控报警回调的有趣实践。
877 0
通过云监控(CMS)报警回调实现云服务器报警信息的语音播报
|
弹性计算 人工智能 Serverless
阿里云ACK One:注册集群云上节点池(CPU/GPU)自动弹性伸缩,助力企业业务高效扩展
在当今数字化时代,企业业务的快速增长对IT基础设施提出了更高要求。然而,传统IDC数据中心却在业务存在扩容慢、缩容难等问题。为此,阿里云推出ACK One注册集群架构,通过云上节点池(CPU/GPU)自动弹性伸缩等特性,为企业带来全新突破。
|
弹性计算 缓存 运维
【运维知识进阶篇】用阿里云部署kod可道云网盘(DNS解析+CDN缓存+Web应用防火墙+弹性伸缩)(三)
【运维知识进阶篇】用阿里云部署kod可道云网盘(DNS解析+CDN缓存+Web应用防火墙+弹性伸缩)(三)
476 0
|
SQL 弹性计算 分布式计算
阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%
阿里云开源大数据平台 E-MapReduce 重磅推出托管弹性伸缩功能,基于 EMR 托管弹性伸缩功能,您可以指定集群的最小和最大计算限制,EMR 会持续对与集群上运行的工作负载相关的关键指标进行采样,自动调整集群大小,以获得最佳性能和资源利用率。
660 15
|
弹性计算 监控 开发工具
【阿里云弹性计算】实战教程:如何高效利用阿里云ECS弹性伸缩应对业务高峰
【5月更文挑战第20天】本文介绍了如何使用阿里云ECS弹性伸缩服务应对业务高峰。通过自动调整云资源规模,弹性伸缩在流量增加时扩展实例,流量减少时收缩实例,实现成本与性能的优化。步骤包括开通服务、创建伸缩组、设定规则和监控指标。文中还提供了一个Python脚本示例,并强调了优化策略,如应用无状态设计、考虑冷却时间和结合云监控。通过实践和调整,企业可以有效应对业务波动。
587 5
下一篇
开通oss服务