开发者学堂课程【玩转云上智能运维:云上高弹性,低成本的解决方案】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/118/detail/1970
云上高弹性,低成本的解决方案
内容介绍:
一、ECS 计算产品家族谱
二、ECS 付费选择
三、低成本的最佳实践
四、ECS 资源弹性交付方式
五、云上弹性面临的挑战
六、弹性伸缩概括
七、弹性伸缩的核心概念
八、多种伸缩模式
九、多种伸缩模式灵活组合
十、事件驱动
十一、弹性供应(Auto provisioning)
十二、弹性供应的基本组件
十三、弹性供应的产品优势
十四、产品链接
l ECS计算产品家族谱
l ECS 付费选择
付费方式的灵活使用是获得业务敏捷性的基础,也是降低 IT 成本的最核心手段,阿里云 ECS 提供极多样的资源付费方式:
l 低成本的最佳实践
抢占式实例:支撑无状态且可容错的业务负载
按量实例:支撑有状态且动态变化的业务负载
包年包月、预留实例:支撑稳定的业务负载
(多种付费类型组合最低成本完成业务支撑)
l ECS 资源弹性交付方式
Ø CreateInstance ECS OpenApi:最早期提供的接口能力:单实例的交付方式;附加后续流程实例最终运行起来
Ø RunInstances ECS OpenApi:批量实例交付方式(100+);一次调用满足交付;单可用区+单实例规格
Ø 弹性伸缩 Auto Scaling:自动化的交付工具;批量实例交付方式(2000/50000);一次配置重复使用;定时+监控触发+主动触发+预测;多实例规格+多可用区;成本优化
Ø 弹性供应 ECS Auto Provisioning.:ECS原生大规划交付;交付资源->交付计算力;批量实例交付方式(2000/50000);一次配置重复使用;按量+Spot+RI;多实例规格+多可用区
l 云上弹性面临的挑战
1) 用户增长,对系统容量需求增加(比如创业公司app爆红后频繁无法访问)
2) 有高峰和低谷,日常定时扩容缩容(比如在线视频网站晚上8-12点会迎来高峰期
3) 热点活动爆发,紧急扩容(比如艺人爆出八卦引发社交用户热议)
4) 年度大促,临时扩容(比如电商会在双11进行大促销)
5) 业务低谷期也保有全量资源,闲置成本高(比如所有资源都包年包月购买
l 弹性伸缩概括
Ø 伸缩组最大实例:2000-50000
Ø 组合方式:多可用区(5)+多实例规格(10)
Ø 3种策略:优先级|均衡|成本优化
Ø 5种伸缩模式:定时|动态(简单+目标追踪+预测)人工|固定|健康检查
Ø 通过云监控实现弹性:17 种metrics(ongoing:ARMS、SLS)
Ø 事件通知能力:事中+事后(Hook+Notification)
l 弹性伸缩的核心概念
1) 伸缩组:
伸缩组实例数设置;多可用区;优先级和均衡分布;SLB 和 RDS,附加+分离操作;健康检查
2) 伸缩配置:
实例规格,镜像预设密码;支持 Tag,支持 RamRole 和 Userdata;支持修改配置功能,无需重建
3) 伸缩规则和通知:
调整至|增加|减少;伸缩活动成功、失败、拒绝实时通知;对接云监控系统事件&MNS 主题/队列
4) 伸缩任务:
定时任务,支持1年+临期提醒;报警任务;自动或手动触发
l 多种伸缩模式
不同伸缩规则对应了不同的伸缩模式,伸缩组支持多种模式组合使用
1. 健康模式:
² 释放或移出不健康的 ECS 实例(非保护状态或备用状态的 ECS 实例)
² 伸缩组对所有模式默认提供
2. 固定模式:
² 通过指定 MinSize 来保证固定数量的 ECS 实例
² 适合业务波动不大但有高可用要求的场景,一般与监控模式一起使用
3. 手工模式:
² 根据人工观察监控数据或者用户自有的监控系统,通过API手工伸缩ECS实例
² 手工执行伸缩规则
² 手工添加/移出既有的 ECS 实例
² 手工调整 MinSize/MaxSize 后自动创建或释放 ECS 实例,将实例数量维持在Min~Max 之间
4. 定时模式:
² 根据配置定时(如周五13:00:00)地增加或减少 ECS 实例
² 适合业务波动具有一定规律的场景
5. 动态模式:
² 基于监控指标(如 CPU 利用率)的负载情况,根据配置自动创建或释放ECS实例
² 适合业务波动没有明显规律的场景
l 多种伸缩模式灵活组合
Ø 定时模式:根据配置定时(如周五13:00:00)地增加或减少 ECS 实例
Ø 动态模式:基于云监控指标(比如 CPU 使用率)负载情况,根据配置自动伸缩
Ø 手动+动态模式:手动添加包年包月实例(不会被移出伸缩组)确保业务基座
Ø 定时+动态模式:在定时配置进行扩缩容的基础上,根据监控指标动态进一步调整ECS 实例数
Ø 动态模式-预测模式:根据用户伸缩组最近1-14天的CPU使用情况和实例个数数据进行建模然后通过机器学习预测算法预测未来2天整体的使用情况,并自动进行扩缩容操作
l 事件驱动
OpenApi(开放接口)+Notification(事件通知)+Hook(生命周期挂钩)
l 弹性供应(Auto provisioning)
·一种全新算力交付方式,一键开启跨售卖方式、跨规格族、跨可用区的计算集群交付,一次配置自动托管
·通过动态规划算法,根据用户设定的购买量和策略,自动帮用户选择最合适的资源,并持续维持目标算力
l 弹性供应的基本组件
① 目标容量:指算力的总数量,单位可以是 VCPU 个数,也可以是实例个数
② 实例权重:指每个实例规格对目标容量的贡献度,权重越大,单台实例满足计算力需求的能力越大,所需的实例数量越小。权重根据指定实例规格的计算力与集群单节点最低计算力得出,假设单节点最低算力为 8 VCPU/60GB, 则 8 VCPU/60GB的实例权重为1,16VCPU/120GB 实例规格权重为 2,也可以将每个实例规格的权重与其 VCPU 数量保持一致
③ 实例优先级:指交付算力时选择每种实例规格的先后顺序,优先创建优先级高的实例;与按量实例的优先级策略配合使用,0 表示优先级最高,随着数字增大而降低
④ InstancePoolToUseCount :指在成本优化策略时,希望选择最便宜的实例规格数量
l 弹性供应的产品优势
① 超低成本:低至1折;按秒计费,可全部使用 spot 实例交付,最高可省 90% 成 本;支持设置全局和单个实例规格价格上限
② 灵活丰富:多种策略组合,可分别指定 spot 和按量实例的交付策略,以及差额补足的策略,包括成本最低、打散和折中
③ 超高效率:快速交付,单个供应组支持 20 种实例规格+多可用区部署,可分钟级快速交付 2000 实例
④ 稳定可靠:智能打散,多个资源池之间进行打散,降低 spot 被集体释放的风险;自动托管,分钟级巡检,动态保证集群的算力.
l 产品链接
Ø 弹性伸缩
产品介绍:
https://www.aliyun.com/product/ecs/ess
产品文档:
https://help.aliyun.com/document detail/25857.html
产品控制台:
https://essnew.console.aliyun.com/
Ø 弹性供应
产品文档:
https://help.aliyun.com/document detail/120020.html
产品控制台: