广义的自助服务包含以下服务内容:
自动化部署
自动化交付
自动化编排
准确实时的事件: 一般来说,云厂商会通过 API 或者消息队列,将不同的事件类型、事件名称、事件含义、事件状态和事件等级等信息,推送给用户。用户可以根据事件的形态和类别,进行主动或者自动的做处理和响应,例如实现预测机器可能会发生宕机,通过发布系统主动运维触发的实例重启(Reboot)类型事件来规避不可预期的风险。除了风险类事件,也可以将创建启停资源等事件实时推送,方便做事件的自动化处理和诊断。
监控预警: 基础的云监控服务可用于获取阿里云资源的相关指标,探测互联网服务可用性,以及针对指标设置警报。包括事件体系自动化完成系统的扩缩容。
自助问题诊断和修复: 通过暴露 API 和自助诊断的能力,客户可以借助平台提供的能力检测云资源是否有问题并修复问题。通过自动化工具,用户可以进行问题诊断,自助工具会告知用户问题的根因,进而一键修复问题,解决问题时间缩短至分钟级。
以上内容摘自《云上自动化运维(CloudOps)白皮书》电子书,点击https://developer.aliyun.com/topic/download?id=8190可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。