AIOps 会抢走你的工作吗?

简介:

在今年5月的Google IO开发者大会上,Google隆重介绍了其一款黑科技产品的功能升级——Google助手(Google Assistant),能够像真人一样通过电话为主人预约生活服务。在演示视频中,Google助手致电理发店和餐馆,像真人一样经过多轮沟通后顺利完成预约任务,而通话对方完全没有发觉自己是在和一个软件对话。如果你对人工智能话题有所关注,你应该知道「图灵测试」:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有人工智能。而从视频来看,Google助手显然已经达到了这个标准。

43af11892bfab9221aa292d0bfc734c7f4036a06

Google Assistant先拨通了Jim理发店的电话,进行电话预约剪发

如果你还没意识到什么,让我们继续来举例:Google旗下DeepMind公司制造的Alpha Go从2015年开始,在短短两年间击败多名围棋职业棋手,在世界职业围棋等级分排行网站Go Ratings上一度排名世界第一,并且最终在2017年以3:0击败了当时已蝉联三年世界第一的棋手柯洁。

Gartner在上个月发布报告《Lessons Learned From Chinese Companies’ AI Projects》(中国企业的AI项目带来的启示)中预测,到2022年,中国开发的B2C和B2B2C应用中有40%将包括人工智能技术。通过对宝尊电商、东方航空、兴业银行、特曲农业和徐工机械五个不同行业的AI项目进行深入研究,Gartner发现企业对于AI技术应用的主要动机有两点:提高效率及降低成本。这些AI项目非“概念”与“实验”,而是已经真正投产到生产系统之中,在各自的企业中发挥了价值,并且带来了相应的数字效益。

从科幻小说到现实生活,AI已经无可避免地进入生产可用阶段,确实已替代人力去解决问题。

由此不禁想起霍金曾预言,人工智能可能会发展到非常强大的程度,可能取代人类,甚至在完全无意的情况下毁灭人类。那么,从事IT工作的你是否也曾担心:AIOps的未来是否会取代运维人员?

AI与Ops

早在2016年,Gartner就已经提出了AIOps的概念并宣称,到2020年,将近50%的企业将会在他们的业务和IT运维方面采用AIOps,远远高于今天的10%。理解AI与Ops的关系,不如从Gartner的理解入手。

AIOps在Gartner的词库中是AlgorithmicIT Operations的缩写,字面的解释是一种基于AI算法的运维方式,Gartner在今年发布的《Market Guide for AIOps Platforms》报告中为AIOps作出如下定义:AIOps平台是结合大数据、人工智能(AI)或机器学习功能的软件系统,用以增强和部分取代广泛应用的现有IT运维流程和事务,包括可用性和性能监控、事件关联和分析,IT服务管理以及运维自动化。简而言之,AI是不需要人工干预,就能帮助运维人员提高生产力的一种途径。未来,AI是否可以完全取代人类思考,还未可知,但至少在目前看来,这种美好的预期还必须人的智慧去创造。

b6e6f39171130acec2ac3e824bceb5dc7bb685af

另一方面,当越来越多的业务系统、新技术应用承载于IT系统之上,IT系统作为基础设施也迅速拓建和创新: 从过去的物理机,到虚拟化技术带来的虚拟机运载,到当下正热的LXC软件容器,公有云和私有云的应用,运维监控对象的数量和监控难度都呈指数级增长。

天旦一直致力于通过旁路方式实现实时、全量、精准的的业务性能监控,当一次在与国外用户的交流沟通汇总发现,在云环境下,尤其大部分的公有云几乎都不提供获取流量的端口,租户无法突破其封闭式的底层架构而获得详细的业务过程数据。一方面,这让业务的性能变化过程“两眼一抹黑”,无从即刻知晓;另一方面,一旦业务在非人为的情况下产生迁移,就会逃出运维人员的监控视野。随着云计算的普及,这将是广泛存在的运维盲区。天旦研发人员基于SDPM(Software Define Performance Management)思维,应用历年来互联数据引擎的核心算法积累而开发了一款开源的镜像工具,Packet Agent。

4cbba1be88089eb03167c8867de3aa6db64f61c0

Packet-Agent端口镜像工具,旨在帮助用户解决在云环境、虚拟机等复杂环境下无法实时获取完整业务过程数据,感知业务变化的问题,而不需要网络镜像的硬件设备,可适用于Linux,Unix,Mac, Windows等各种操作系统。与PacketBeat、Splunk App for Stream等工具比较,天旦Packet Agent大大节省了机器开销,并且实现了自定义化的协议支持,甚至直接导出数据包(另2种工具尚且无法实现)等功能。(关注天旦公众号“天旦Netis”,输入“镜像”,免费获取Packet-Agent端口镜像工具)

天旦认为,技术的问题,应当交给技术来解决。用AIOps去解决运维中的问题,释放运维的潜力,给予运维人更多的时间去集中思考,找到合适的方法去攻克下一个难题。

AIOps,走出“有多少人,就有多少智能”的 怪圈

Gartner在《Market Guide for AIOps Platforms》报告中指出: 过去三年,IT 运营部门分别部署了大数据和机器学习技术,以支持IT运营的监控。然而,在过去的6个月里,企业已经开始将面向IT运营的大数据和机器学习项目相结合,并将其扩展到服务台和自动化。企业在IT运营(AIOps)平台上使用人工智能来增强并取代传统的应用性能监控(APM)和网络性能监控与诊断(NPMD)工具。

人工智能算法的成长离不开队海量案例的分析和学习,而现在许多所谓AI告警的定制化方案受限于缺乏充足的真实案例,需要在部署后耗费繁重的人工进行后期的调整和维护,原本想要解放劳动力的项目,却成为了耗费人力和时间的黑洞,而且算法效果极不稳定。

天旦作为企业级软件产品公司,通过提供通用性的产品而非定制化的解决方案,使得智能算法真正成熟产品化。多年来,陪伴120+家银行经历数字化转型的整个过程,每天保障超过200亿笔交易的稳定运行,积累了极其丰富的案例资源与经验,为算法的不断完善提供扎实的依据,并转而进一步将成熟的智能化技术应用到产品功能的之中。

天旦业务性能管理BPC,通过算法升级集合智能发现、智能梳理、智能告警、智能预测、智能排障五大模块,使得运维人员只需简单配置全面覆盖的告警规则,结合自动故障定位和自动故障域分析,加速故障发现和分析流程,缩短故障恢复时间。

智能发现:5年自研专利解码引擎,自动发现应用访问关系,自动解析业务数据内容。

智能梳理:通过天旦BPC的核心组件——服务路径图发现,自动梳理业务访问关系,呈现以服务为中心的拓扑视图,让数以月计的业务梳理工作突破性地缩短到天。

fc4f0ffb48bb79a26bdad2a05b69df720c83e402

智能告警:将告警场景归纳为五大类型,几乎涵盖所有常见的高频故障场景。运维人员仅需选择合适的告警场景,智能告警算法将自动匹配与之对应的告警逻辑,大大提高告警的配置效率。

智能预测:实时监控,智能算法自动根据历史表现绘制基线,直观发现变化趋势。

cad1a0b1d65487569734f681a3c1e8fe36a57e4c

智能排障:自动定位故障节点,一键解析造成故障发生的维度和指标,无需专家介入。

正所谓“科学技术是第一生产力”。天旦相信,随着智能化运维技术的不断演进,AIOps脱离人力干预而自动处理运维问题的能力一定会得以实现。

未来:源于「人」

尽管Google助手可以帮助主人像真人一般沟通交流,但无法代替主人决心的每日行程;尽管自动驾驶技术可以如真人驾驶一般控制汽车,但无法代替人决定出行的意愿。AI的使命在于为人类解决问题,而非控制或取代人类。

李开复在TED 2018年度大会上发表演讲说,工业革命把手工工匠的工作转化成大量常规工作(如生产线工作),但是人工智能革命将彻底取代这些生产线工作。不出十五年,驾驶、电话销售、卡车司机甚至是放射科医生等类似工作和事务也将被人工智能取而代之。在这场人工智能摧毁工作的浩劫中,唯有创造性工作才能从中全身而退。在所有重复性工作上,人工智能都将高出人类一筹。但我们并非因为擅长重复性工作而为人。

c986b443bdeaf07290f1211012dcdeb9503be0e2

天旦相信,随着数字化转型的深入,AIOps必将成为运维组织高效运作的关键所在。运维过程中琐碎、重复的工作终将被由智能化的工具所替代,但却无法磨灭运维人的存在使命:基于运维系统的深刻理解,做智能化运维的指挥官,谋略布局。而天旦也将继续精进算法、积累行业经验,将智能化的技术植根于产品研发与功能设计的细节之中,帮助“运维指挥官”释放运维的智慧潜力,为企业在数字化转型之路上创造更多业务可能。


原文发布时间为:2018-09-13

本文作者:Netis天旦

本文来自云栖社区合作伙伴“高效运维”,了解相关信息可以关注“高效运维”。

相关文章
|
25天前
|
机器学习/深度学习 人工智能 运维
智能运维:AIOps在大型系统运维中的实践与挑战
【10月更文挑战第28天】随着云计算、大数据和人工智能的发展,AIOps(人工智能运维)应运而生,旨在通过算法和机器学习提高运维效率和质量。本文探讨了AIOps在大型系统运维中的实践与挑战,包括数据质量、模型选择和团队协作等方面,并通过一个异常检测案例展示了其应用。尽管面临挑战,AIOps仍有望成为未来运维的重要方向。
53 5
|
27天前
|
机器学习/深度学习 运维 监控
智能运维未来:AIOps在预测性维护与故障排查中的潜力
【10月更文挑战第26天】随着数字化转型的深入,企业对IT系统的依赖日益增加。传统的运维方式已无法满足需求,智能运维(AIOps)应运而生。AIOps通过集成和分析多源数据,利用机器学习算法实现系统状态的实时监控和预测性维护,显著提升了运维效率和质量。 示例代码展示了如何使用Python和scikit-learn实现故障预测模型,进一步说明了AIOps的应用价值。
90 5
|
5月前
|
机器学习/深度学习 运维 监控
智能化运维:利用机器学习优化IT基础设施管理
【7月更文挑战第28天】在数字化时代,智能化运维成为企业提升效率、降低成本的关键。本文将探讨如何通过机器学习技术,实现对IT基础设施的智能监控与自动化管理,包括预测性维护、异常检测和性能优化等策略,旨在为读者提供一套实用的智能化运维解决方案。
|
5月前
|
机器学习/深度学习 人工智能 弹性计算
智能化运维:AI在故障预测与自我修复系统中的应用
随着技术的不断进步,传统的运维模式已逐渐不能满足现代企业的需求。本文将探讨如何通过人工智能技术,特别是机器学习和深度学习算法,实现对IT系统的实时监控、故障预测以及自动化修复。我们将分析AI技术在智能运维中的具体应用案例,并讨论其带来的效率提升和成本节约效果。文章旨在为读者提供一种全新的运维视角,展示AI技术在提高系统稳定性和减少人工干预方面的潜力。
|
5月前
|
机器学习/深度学习 数据采集 人工智能
智能运维:机器学习在系统维护中的应用与挑战
本文深入探讨了机器学习技术在IT运维领域的应用,并分析了其带来的优势及面临的主要挑战。文章首先概述了智能运维的发展历程和当前趋势,随后详细讨论了机器学习技术如何优化故障预测、自动化处理流程以及增强安全监控。最后,文中指出了实施过程中可能遇到的技术和管理难题,为读者提供了对智能运维未来发展方向的深刻见解。
|
5月前
|
机器学习/深度学习 运维 安全
智能化运维:利用机器学习技术优化IT基础设施管理
在信息技术迅猛发展的今天,传统的运维管理模式已难以应对日益复杂的IT基础设施。本文探讨了如何通过集成机器学习技术到运维流程中,实现智能化的运维管理。文章首先介绍了智能化运维的概念及其必要性,随后详细阐述了机器学习在故障预测、自动化处理和安全防护等方面的应用,并通过具体案例展示了智能化运维的实际效果。最后,讨论了实施智能化运维时可能遇到的挑战及未来发展趋势。
93 2
|
5月前
|
机器学习/深度学习 运维 监控
智能化运维:机器学习在故障预测和自动化修复中的应用
随着信息技术的迅猛发展,企业对运维工作的效率和准确性要求越来越高。传统的运维模式已难以应对日益复杂的系统环境和数据量。本文将探讨如何利用机器学习技术提升运维工作的智能化水平,实现故障的早期预测和自动化修复,从而减少系统停机时间,提高企业运营效率。通过分析机器学习在运维领域的应用实例,揭示其在实际工作中的有效性和潜力。
76 0
|
5月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在系统监控中的应用
随着信息技术的飞速发展,传统的运维管理方法已难以应对日益增长的系统复杂性。本文将探讨如何利用机器学习技术优化运维流程,实现智能化系统监控,提升效率与准确性。通过分析机器学习在预测性维护、异常检测和自动化响应等方面的应用案例,揭示数据驱动的运维新模式对提升系统稳定性和性能的重要性。
|
5月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在系统维护中的角色与影响
随着技术的不断进步,机器学习已成为推动智能运维发展的关键力量。通过分析历史数据、模式识别和预测性维护,机器学习不仅优化了传统运维流程,还极大地提高了效率和准确性。本文将探讨机器学习在智能运维中的应用,包括故障预测、自动化响应和资源优化等方面,旨在为读者提供深入的理解和可行的应用建议。
|
6月前
|
机器学习/深度学习 运维 数据挖掘
智能化运维:利用机器学习优化数据中心
【6月更文挑战第28天】本文将探讨如何通过机器学习技术来优化数据中心的运维工作。我们将首先介绍机器学习的基本原理,然后详细讨论其在数据中心运维中的应用,包括故障预测、性能优化和自动化运维等。最后,我们将通过一个实际案例来展示机器学习在数据中心运维中的实际效果。