云资源监控能力,是指应用依赖的底层资源监控,比如资源的 CPU、内存、网络等指标的使用率等。通过基础监控,用户可以自助发现云资源发生的异常,这是可观测性最基础的能力,比如阿里云的云监控(Cloud Monitoring Service)、AWS 的 CloudWatch 都提供了云资源监控能力。
云厂商同时会提供云资源的诊断能力,用户可一键发起对云资源的诊断,来自助发现云资源可能存在的问题。更进一步,云厂商会提供运维事件能力,比如 AWS 和阿里云均提供了运维事件能力。用户可以基于云的服务能力,通过 OpenAPI 或者事件订阅等方式感知到云资源的异常事件,并通过自定义操作来实现云资源的自动化运维,提升云资源使用的极致可靠性。关于运维自动化编排能力,AWS 的 system manager 与阿里云的运维编排 OOS 产品提供了上述场景的解决方案。
以上内容摘自《云上自动化运维(CloudOps)白皮书》电子书,点击https://developer.aliyun.com/topic/download?id=8190可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。