开发者社区 问答 正文

构建立体化的监控体系——58集团监控实践

58集团技术工程平台群龚诚在2017APMcon中国应用性能管理大会上做了题为《构建立体化的监控体系——58集团监控实践》的分享,就如何快速获得监控收益,构建立体化的监控体系,提升监控系统用户体验,智能化监控和告警信息做了深入的分析。

https://yq.aliyun.com/download/714?spm=a2c4e.11154804.0.0.41426a79s2piKc

展开
收起
福利达人 2018-06-20 22:21:37 1064 分享 版权
阿里云 AI 助理回答

58集团技术工程平台群的龚诚在2017APMcon中国应用性能管理大会上的分享,重点在于构建一个立体化的监控体系,这对于确保系统的稳定运行、及时发现并解决问题至关重要。虽然我无法直接访问外部链接或下载文件,但我可以基于阿里云的产品和服务,为您提供一些建议和思路,帮助您实现类似目标。

构建立体化监控体系的关键点

  1. 全面覆盖:首先,要确保监控覆盖应用的全生命周期,包括前端用户体验、后端服务性能、数据库访问效率、网络延迟等各个环节。阿里云提供了如ARMS(应用实时监控服务)、CloudMonitor(云监控)等工具,可以帮助您从多个维度收集数据。

  2. 快速响应:为了快速获得监控收益,需要设置合理的阈值和高效的告警机制。阿里云云监控支持自定义告警策略,一旦指标超出预设范围,即可通过短信、邮件、钉钉等多种方式迅速通知到相关人员。

  3. 智能化监控:利用机器学习和AI技术对监控数据进行分析,自动识别异常模式,减少误报和漏报。阿里云ARMS提供智能异常检测功能,能够自动发现并预警潜在问题。

  4. 用户体验优化:关注用户端的体验,比如页面加载时间、错误率等,使用Real User Monitoring (RUM)功能来获取真实用户的使用情况。阿里云ARMS的Browser监控可以帮助您实现这一点。

  5. 可视化与数据分析:将监控数据以图表形式直观展示,便于快速定位问题和趋势分析。阿里云的DataV、QuickBI等产品能帮助您创建丰富的数据可视化界面。

  6. 系统集成与自动化:将监控系统与运维流程、故障自愈系统集成,实现问题的自动发现、诊断到修复的闭环。阿里云的SREWorks、OOS(操作编排服务)等可以支持此类自动化运维场景。

实践建议

  • 分阶段实施:根据业务需求和资源情况,逐步推进监控体系的建设,先从关键业务和高风险环节开始。
  • 持续优化:监控体系不是一成不变的,需要根据业务发展和技术进步不断调整优化。
  • 培训与文化:培养团队的监控意识,定期进行技能培训,形成良好的监控文化和实践习惯。

通过借鉴58集团的监控实践,并结合阿里云提供的丰富工具和服务,您可以有效地构建立体化的监控体系,提升系统的稳定性和运维效率。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答