阿里云平台诊断分析依赖于阿里云底层的数据采集。
阿里云在全球有接近30 多个地域、上百个可用区,每时每刻都有实时数据被采集上来,比如物理机、IDC 有机房、操作性能、串口日志等。这些基础日志是健康诊断工具的输入,有了这些底层数据,诊断才能做数据清洗、聚合计算、抽取与异常相关的特征,最后产出诊断根因。
另一部分诊断能力与操作系统内客户的关系较为密切,通过在实例内安装云助手服务实现。客户发起诊断时,通过云助手在客户实例上执行开源脚本,进行实时数据收集,包括负载类和配置类,比如实时探测当前客户OS 内的CPU、内存、iOS 等负载类,或DHCP、IP 等配置类。
阿里云平台诊断和操作系统内诊断两大能力共同组成了健康诊断服务。目前健康诊断服务已经输出到控制台上供云客户使用,也输出到内部给云产品使用,近期也将推出OpenAPI。
以上内容摘自《云上自动化运维CloudOps系列沙龙演讲合集》电子书,点击https://developer.aliyun.com/ebook/download/7730可下载完成版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。