开发者社区 问答 正文

AIOPS提升数据驱动的云托管服务

上海驻云 李俊涛在2018云栖大会·上海峰会中做了题为《AIOPS提升数据驱动的云托管服务》的分享,就云时代的托管服务,基础、应用、业务运维体系,AIOPS提升数据驱动服务等方面的内容做了深入的分析。

https://yq.aliyun.com/download/2736?spm=a2c4e.11154804.0.0.588d6a793pEumq

展开
收起
福利达人 2018-07-30 23:31:36 1237 分享 版权
阿里云 AI 助理回答

在2018云栖大会·上海峰会上,上海驻云的李俊涛分享了题为《AIOPS提升数据驱动的云托管服务》的主题,深入探讨了云时代下托管服务的发展,特别是如何通过AIOPS(智能运维)加强数据驱动的服务能力,涉及基础运维、应用运维、业务运维体系的优化与升级。根据知识库中的参考资料,我们可以概括其核心要点如下:

背景与需求

  • 用户背景:随着企业加速上云并追求高效利用云资源,运维复杂度显著增加,面临技术栈多样化、告警配置繁琐、故障定位耗时长等问题。
  • 需求目标:需要一种能够整合监控数据、自动化分析异常、快速定位根因并自愈的智能运维解决方案,以提高运维效率和业务稳定性。

解决方案概述

  • AIOps应用:采用人工智能与运维相结合的AIOps策略,运用机器学习技术对监控指标进行实时分析,实现异常诊断、根因分析、资源编排及故障自愈等功能。
  • 服务内容:提供包括时序趋势预测、风险异常巡检、智能诊断监测、智能根因推荐等服务,旨在解决传统运维体系分散、效率低下等问题,实现全栈式IT运维管理。

具体实施步骤

  • 环境准备:基于阿里云ECS等弹性计算服务构建稳定且可扩展的基础架构。
  • 系统部署:集成AIOps平台,对接现有监控系统,建立KPI实时异常检测机制,并配置多维度指标的根源分析能力。
  • 数据处理:利用MaxCompute等大数据处理服务进行数据仓库建设与优化,支持复杂数据分析处理。
  • 安全合规:确保整个架构符合行业安全标准,利用阿里云提供的DDoS防护、数据加密等功能保障数据安全。
  • 性能优化:持续监控与调优,利用云产品的弹性特性动态调整资源,确保高性能运行。

关键技术与产品

  • 云服务器ECS:提供安全可靠的弹性计算服务,支撑业务快速部署与扩展。
  • AIOps解决方案:实现智能运维,提升运维效率与业务连续性。
  • MaxCompute:用于大数据存储与分析,支持数仓建设和复杂的数据处理任务。

应用场景与优势

  • 适用于多云环境下的复杂业务系统,能显著减少故障影响时间(MTTR),提升运维效率,增强资源利用率,助力企业进入智能化运维时代。

注意事项与建议

  • 实施过程中需关注系统集成的平滑度,确保新旧运维体系的顺利过渡。
  • 定期评估AIOps系统的准确性和效率,不断迭代优化模型。
  • 加强团队对AIOPS工具的培训,促进人机协同,最大化技术投资回报。

综上所述,李俊涛的分享聚焦于AIOPS如何在云托管服务中通过数据驱动提升运维效能,强调了从技术选型到实施策略的全方位考虑,为企业迈向智能化运维提供了实践指导。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答
问答分类:
问答地址: