第六章(上):OOS 与总结
本章概要
• 本章主要介绍运维编排产品和产品侧最佳实践,以及本次训练营的整体回顾。
课程目录
• 云上运维的挑战
• OOS 基本概念
• OOS 模板
视频地址
https://developer.aliyun.com/learning/course/1039/detail/15320
一、 云上运维的挑战
1. 业内发展趋势
1) 自动化运维编排的发展阶段
• 第一阶段:纯手工,运维人员通过 GUI(控制台)手工操作完成。
• 第二阶段:半手工、半自动化,运维人员通过命令行 CLI 操作、编写 Shell 脚本,再配合一部分手工配置操作完成。
• 第三阶段:高度自动化,通过自动化运维系统(OpenAPI、SDK)完成。
• 第四阶段:DevOps 标准化运维,通过 Codify(as code)CI/CD 等工具完成。
• 第五阶段:AIOps,AIOps 是自动化发展的终极目标,但只适用于特定场景。
2) 自动化编排国内外现状对比
• 欧美的 IT 客户在自动化成熟度上更高,自动化完成率更高,因为人工成本很高,所以只要是能自动化的地方,全部用自动化替代。
• 国内客户的自动化还处于偏下水平,大量依靠控制台运维的客户,和使用
terminal tool 或 script 初级的 Automation 客户。
2. 云上运维的挑战
云上运维的挑战主要体现在三个方面:
1) 效率难以满足敏捷需要
• 大规模实例,批量操作和运维费时费力。
• 人工运维的效率跟不上业务持续交付的需求。
• 经常要半夜发布做运维,幸福感低。
2) 日常管理和安全生产难度加大
• 缺少运维积累和规范,难以形成标准化流程和工具。
• 操作影响面广,存在安全生产风险隐患,权限管理困难和操作不可审计系统。
3) 告警处理效率低
• 7*24 小时待命,遇到告警立即上线处理耗费精力,幸福感低。
以上这些运维问题,能否自动化的进行处理,对于运维人员来说非常重要。
3. 运维编排实现 Ops 即自动化代码
为解决上述云上运维的挑战,衍生出一系列运维编排产品。通过这些产品自动化的将一些运维事件、运维能力实现可编排,以降低运维在云上的资源挑战。
• 多样模板:使用 JSON/YAML 将资源和需要定义的对象代码化。
• 覆盖全面:跨云产品和跨地域,不止针对 ECS,还有 RDS、SLB 等云产品。
• 简单高效:模板可视化和模板克隆。
• 开放生态:模板开源,让更多人可以高效的使用运维编排能力。
• 安全可靠:云上完备鉴权审计,比如通过授权 RAM 权限来限制使用。
《企业运维之弹性计算原理与实践》——第六章 OOS 与总结——第六章(上):OOS 与总结(2) https://developer.aliyun.com/article/1231384?groupCode=supportservice