阿里云自动化运维-OOS-触发式带宽自动临时升级

简介: 对于初创公司而言,公司的网站流量暴增的时间点往往具有不确定性。预备富余的带宽,虽然可以提升用户的访问体验,但是平时的带宽使用率并不大,这就造成了带宽的浪费,而且增加了不必要的开销。本文将介绍如何使用OOS实现,当流量访问大的时候自动提升带宽,热度下降自动降低带宽。既提升用户访问体验,又有的放矢,节省公司的带宽成本。

一、什么是OOS
当我们接触到一个新的事物时,往往会关心,它是什么?有什么用?
1.png

OOS的英文全称是,Operation Orchestration Service (阿里云运维编排服务)直译为“操作编排服务”,顾名思义,它可以将一组的操作编排在一起。
比如说,当服务器的cpu使用率持续较高,磁盘容量不足,带宽常常满载等。这个时候,我们的运维人员,首先,需要升级CPU,且升级后需要重启服务器;其次,需要扩容磁盘,且扩容磁盘前,还需要先对磁盘进行快照备份数据;最后,需要升级服务器带宽。
按照常规的做法,需要一步步手动操作,相对来说比较繁琐,且改动需要在业务低峰期,所以常常需要在深夜进行调试。对于运维人员来说,身心疲惫,加上操作繁琐,出现误操作的概率大大增加。对于企业来说,这不但降低降低了工作效率,而且还增加了失误的风险。
a1.png

那么OOS怎么帮我们解决这个问题呢?
OOS可以将这些服务器的运维操作都编排到OOS模板中,当需要时一键启动,自动执行。模板化的操作,提升效率的同时,降低了误操作的风险。让运维更加的准确和高效。这就是OOS,而触发式带宽自动升级,也是通过OOS实现,我们看看是怎么做到的吧。
a2.png

二、 触发式带宽自动临时升级OOS模板简介
a3.png

模板的架构图如上,详细说明如下:

(1) 监控触发。通过云监控CMS对服务器公网带宽进行监控,当服务器的带宽使用率达到阈值时,会自动启动OOS的预设模板(后文提供),准备对服务器的带宽进行升级操作。

(2) DDos检测。正式升级服务器带宽前,会对服务器的DDOS状态进行检测,避免服务器带宽满载是由DDOS攻击导致。DDOS攻击是一种资源消耗型的攻击,如果检测状态为异常,则会通过钉钉机器人告知用户,相关运维人员可以通过钉钉机器人提供的链接,来登录DDOS控制台确认并处理异常,模板的运行也会就此自动终止。

(3) 阈值通知。DDOS检测通过后,在带宽正式升级前,会通过钉钉机器人发出阈值通知,告知用户,阈值触发了OOS进行带宽升级。

(4) 升级带宽。当前环节,会对服务器的带宽进行临时升级。升级完成后,通过钉钉机器人通知客户服务器带宽升级成功。当升级出现错误时,会通过钉钉机器人进行反馈,并停止模板。

(5) 结果反馈。带宽升级成功后,还会检测升级后的带宽使用率,进一步将升级结果反馈给用户。

三、 模板的运行结果展示
场景描述:通过从服务器下载文件,模拟服务器的出方向带宽达到阈值,触发OOS调用模板实现带宽自动的升级。
下图为服务器公网出方向的带宽使用情况(初始固定带宽为1M)
流量图.png

14:05 流量开始满载(达到阈值)
14:15 OOS监测达到阈值,并触发模板(满载到触发用时10分钟,后续说明)

  同时向钉钉机器人发送带宽达到阈值的通知

14:18 带宽临时升级完成(固定时间,3分钟)
14:20 向钉钉机器人发送通知---带宽升级成功(固定时间,5分钟)
14:25 向钉钉机器人发送通知---升级后,带宽使用率(固定时间,10分钟)

其他说明:
关于带宽满载到OOS模板被触发,用时共10分钟的问题。本模板使用的触发条件,为OOS中“告警与事件运维”中的阈值告警。由于云监控中公网出方向带宽使用率仅支持平均值,而OOS依赖云监控作为模板触发条件,所以OOS也只支持平均值,上图数据使用的是最大值,所以导致触发时间过长(后续,官方应该会优化)。建议大家设置“触发规则”参数时,使用带宽使用率的平均值作为阈值触发的指标。
a4.png

钉钉机器人收到的通知示意
升级触发通知:
ding1.png

升级完成通知:
ding2.png

升级成效通知
ding3.png

四、 费用预估
1M升级到50M,持续时间为24小时,费用约为:120元
1M升级到100M,持续时间为24小时,费用约为:250元
1M升级到200M,持续时间为24小时,费用约为:500元
可根据上述区间,粗略估算,升级产生的费用。如需查看准确的价格,请参照下面链接中的步骤,进行查看
https://help.aliyun.com/document_detail/59717.html?spm=5176.11065259.1996646101.searchclickresult.b8037bcdFtHGnv

五、 实现步骤
1.创建模板
点击链接:https://oos.console.aliyun.com/

s1.png
s2.png
s3.png

2.创建OOS扮演的角色
参考链接创建角色,并添加下图中的权限,即可(https://help.aliyun.com/document_detail/120810.html?spm=5176.11065259.1996646101.searchclickresult.1d9375f5f0ablH
s4.png

3.创建钉钉机器人,获取升级通知
参数如下链接中创建钉钉机器人的步骤创建机器人
https://help.aliyun.com/document_detail/144679.html#h2--2-webhook-5
并在钉钉机器人的设置中添加“阿里云”为自定义关键词
s9.png

4.创建OOS“告警与事件运维”
s5.png
s6.png
s7.png
s8.png
s10.png
s11.png
s12.png

“触发式带宽自动临时升级”的OOS模板,到此已经创建完成,当带宽达到阈值时,会按照模板设置的参数自动升级带宽,升级后带宽的持续时间是可以自定义的,到期后,带宽会自动回落到升级前的水平,节省带宽成本。

六、 模板提供
创作不易,感谢大家的支持,当文章的阅读量,达到2000+,将会在文章更新提供模板。有劳转发,感谢大家。

目录
相关文章
|
4天前
|
存储 监控 安全
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
为了提供更好的日志数据服务,360 企业安全浏览器设计了统一运维管理平台,并引入 Apache Doris 替代了 Elasticsearch,实现日志检索与报表分析架构的统一,同时依赖 Doris 优异性能,聚合分析效率呈数量级提升、存储成本下降 60%....为日志数据的可视化和价值发挥提供了坚实的基础。
360 企业安全浏览器基于阿里云数据库 SelectDB 版内核 Apache Doris 的数据架构升级实践
|
4天前
|
Cloud Native 关系型数据库 分布式数据库
阿里云瑶池助力九州通B2B电商平台,完成100%云原生架构升级
九州通数字化转型,通过引入阿里云云原生数据库PolarDB,云原生内存数据库Tair等产品,完美支撑了医药电商平台数据库100%云原生化,实现了统一、高效、标准化和可跟踪的B2B医药平台。
392 4
|
4天前
|
人工智能 算法 物联网
阿里云百炼最新能力升级,你都有哪些期待?
阿里云百炼大模型服务产品全新升级,探索算法和技术创新,共享阿里集团内环业务的模型构建经验。
|
4天前
|
机器学习/深度学习 人工智能 安全
AI战略丨阿里云百炼再升级:模型、工具、AI能力,快速接入、应有尽有
阿里云百炼持续加码模型服务,基于丰富的底层计算能力与通义系列模型的最佳实践,构建训练评测、标注、部署全生命周期模型工具,帮助企业、开发者在云上一站式调用、优化大模型,成为大模型时代的商业化基础设施。
|
4天前
|
消息中间件 人工智能 监控
|
4天前
|
消息中间件 Cloud Native Serverless
飞天发布时刻丨阿里云 ApsaraMQ 全面升级,携手 Confluent 发布全新产品
阿里云在3月29日的飞天发布时刻宣布ApsaraMQ全面升级,实现全系产品Serverless化,与Confluent合作推出新产品,强化云原生消息队列服务。
|
4天前
|
弹性计算
2024阿里云服务器购买、续费、升级配置价格表新鲜出炉!
2024年阿里云服务器购买、续费、升级优惠政策整理,阿里云服务器优惠价格表:轻量2核2G3M服务器61元一年、2核4G4M带宽165元1年,云服务器4核16G10M带宽26元1个月、149元半年,阿里云ECS云服务器2核2G3M新老用户均可99元一年续费不涨价,企业用户2核4G5M带宽199元一年。
496 2
|
4天前
|
弹性计算 大数据 测试技术
2024年阿里云服务器新购、续费、升级优惠信息整理汇总
随着云计算技术的深入普及,越来越多的企业和个人选择阿里云作为他们的云服务提供商。然而,续费成本往往成为用户考虑的重要因素。为了帮助用户更经济地续费,阿里云推出了一系列优惠活动和代金券。2024年阿里云服务器优惠活动,轻量2核2G3M服务器61元一年、2核4G4M带宽165元1年,云服务器4核16G10M带宽26元1个月、149元半年,阿里云ECS云服务器2核2G3M新老用户均可99元一年续费不涨价,企业用户2核4G5M带宽199元一年
248 2