用户业务层监控,应用于服务所提供的具体应用场景,比如电商类应用通常监控订单走势、订单成功率、支付成功率等。业务层监控通常是通过业务埋点方式实现,传统运维典型的解决方案是 ELK。
云服务厂商会通过产品以服务化的方式来提供日志服务,用户使用日志服务做日志、数据的采集与集成,并基于此做 Logging 和 Metering。用户通过自定义应用系统的内容、格式,并通过日志服务收集,并在日志服务中配置自定义细粒度监控大盘,观测自身业务运行情况,同时配置预警体系,建设用户层问题发现与定位能力。
阿里云的 SLS 作为云原生观测分析平台,为 Log/Metric/Trace 等数据提供大规模、低成本、实时平台化服务,用户可以通过 SLS 构建业务大盘并设置监控预警,同时可以基于 SLS 做全链路的日志串联来进行问题分析与故障定位。
在可观测性能力的基础上,云服务厂商同时会提供应用高可用服务,比如阿里云的 AHAS(Application High Availability Service),可以通过流量防护、故障演练、多活容灾、开关预案来实现自动化流量控制、业务降级与预案执行,更进一步通过混沌工程来完成故障巡检、故障注入、以及系统稳态度量。
以上内容摘自《云上自动化运维(CloudOps)白皮书》电子书,点击https://developer.aliyun.com/topic/download?id=8190可下载完整版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。