智能诊断-人工智能在云平台上的新玩法

简介: 12月7日,苏州云栖大会上,阿里云高级技术专家许玲提出了“智能诊断”这个概念,利用AI技术来完成以下三项核心任务:1、识别风险;2、定位原因3、提供“定制性”解决方案。这里的关键词是“智能”,不需要人工或只需要极少量的人工介入,就能完成传统运维需要大量人力投入来做的事情。

890x421_
说到“运维”能想到的是什么?
稳定性→监控→凡是想得到的,都要监控起来……
时效性→人工排查→查不出,再查,反复查……
安全性→容灾→备份备份再备份……
成本控制→性能优化→加载、维护、配置、升级、补丁……

对传统运维的诉求和困境,同样适用于云上IT系统运维。
screenshot
为解决上述诉求,阿里云高级技术专家许玲提出了“智能诊断”这个概念,利用AI技术来完成以下三项核心任务:1、识别风险;2、定位原因3、提供“定制性”解决方案。这里的关键词是“智能”,不需要人工或只需要极少量的人工介入,就能完成传统运维需要大量人力投入来做的事情。

AI智能的短板:数据
那么要实现智能诊断,最大的短板是什么?答案是“数据”,AI落地成功的四大要素:场景+算法+工程+数据,前三者在不同领域的可复用性相对较高,已经有了不少成功的案例,而唯有数据是强行业属性的,业内有句话叫做“有多少人工,才有多少智能”,要训练算法, AI在实验室里的先进程度远远大于商用的成熟度。商业化落地过程中,传统做法是大量的标注数据,标注的准确性直接决定算法的效果,并且数据需要不断更新,持续调优,流入新生数据,淘汰“过时”数据,因此在“运维辅助”这个专业性非常强的领域一直以来AI都很难大有作为,而云计算平台给数据短板创造了解决的条件。

云平台创造了解决数据短板的条件:在线
云计算平台让数据在线,并提供性价比更高的可扩展的在线计算能力。所谓的数据在线,就是云计算平台能够在线上实时采集到不涉及到用户业务数据的系统行为与用户行为数据,包括IT系统运行时健康数据、系统故障数据、负载特征、配置变更数据、特定用户行为数据。有了实时在线的数据,利用AI自学习技术,就能实现数据闭环,跑通“系统健康监控→诊断过程→诊断结果→实践效果”的链路,并持续纠正。这套“数据闭环,以工程养数据,数据养算法”的AI应用已经在售后服务场景里验证成功。
screenshot

阿里云智能诊断初具雏形
目前阿里云的部分智能诊断能力已经上线并免费开放给用户在使用了,包括

  • 系统资源导致的性能瓶颈、受安全攻击风险、账户欠费或者实例过期引起的服务中断风险;
  • 系统配置不当引起的系统运行时问题等。

screenshot

screenshot

据许玲透露,智能诊断很快会开放更多在性能优化、成本优化、安全监控及修复、容错等核心运维诉求上的诊断能力。AI的商业价值是,做人类做不了的事,做比人类做得更好的事,在运维辅助这个战场上,自动识别风险,定位原因并提供“定制性”解决方案这一目标已经不远了。

相关文章
|
2月前
|
人工智能 小程序 Java
电子班牌管理系统源代码,基于AI人脸识别技术的智能电子班牌云平台解决方案
电子班牌管理系统源码,基于AI人脸识别的智慧校园云平台,支持SaaS架构,涵盖管理端、小程序与安卓班牌端。集成考勤、课表、通知、门禁等功能,提供多模式展示与教务联动,助力校园智能化管理。
179 0
|
3月前
|
机器学习/深度学习 数据采集 人工智能
AI能帮我们读懂心事吗?——聊聊人工智能在精神疾病早期诊断中的探索
AI能帮我们读懂心事吗?——聊聊人工智能在精神疾病早期诊断中的探索
134 5
|
3月前
|
机器学习/深度学习 人工智能 供应链
决策智能是新的人工智能平台吗?
决策智能融合数据、决策与行动,通过AI与自动化技术提升企业决策质量与效率,支持从辅助到自动化的多级决策模式,推动业务敏捷性与价值转化。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能:有多少人工,才能有多少智能?
当下AI大模型的能力,特别是Agent领域,到底离不开多少“人工”的加持?本文将结合我的实际经验,深入探讨高质量数据与有效评价体系在Agent发展中的决定性作用,并通过编码Agent、Web Agent和GUI Agent的成熟度分析,揭示AI智能体发展面临的挑战与机遇。
288 89
|
4月前
|
机器学习/深度学习 人工智能 搜索推荐
AI+基因数据:健康诊断的“未来体检报告”来了
AI+基因数据:健康诊断的“未来体检报告”来了
179 6
|
6月前
|
机器学习/深度学习 人工智能 自动驾驶
人机融合智能 | 以人为中心的人工智能伦理体系
本章探讨“以人为中心”的人工智能伦理体系,分析人工智能伦理与传统伦理学的关系、主要分支内容及核心原则。随着人工智能技术快速发展,其在推动社会进步的同时也引发了隐私、公平、责任等伦理问题。文章指出,人工智能伦理需融入传统伦理框架,并构建适应智能技术发展的新型伦理规范体系,以确保技术发展符合人类价值观和利益。
269 4
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
人机融合智能 | 数据与知识双驱动式人工智能
本章系统介绍了数据驱动、知识驱动及双驱动人工智能的理论与应用。数据驱动方法依赖大数据和深度学习,在图像识别、自然语言处理等领域取得突破,但面临标注成本高、可解释性差等问题。知识驱动方法通过知识表示与推理提升系统理解能力,却在泛化性和适应性上受限。为弥补单一范式的不足,数据与知识双驱动融合两者优势,致力于构建更智能、可解释且安全可靠的AI系统,兼顾伦理与隐私保护。文章还回顾了AI发展历程,从早期神经网络到当前大规模语言模型(如GPT、BERT)的技术演进,深入解析了各类机器学习与深度学习模型的核心原理与应用场景,展望未来AI发展的潜力与挑战。
368 0
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
334 1
|
机器学习/深度学习 算法 数据可视化
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
基于Google Earth Engine云平台构建的多源遥感数据森林地上生物量AGB估算模型含生物量模型应用APP
610 0
|
大数据 定位技术
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
《CDP企业数据云平台从入门到实践》——Cloudera CDP 产品介绍 (3)
459 0

热门文章

最新文章