新华三:智能运维的洞见与预见

简介: 新华三:智能运维的洞见与预见

运维无小事,它是企业IT系统解决各种不确定性风险的“灭火员”。

但传统运维又像是“盲人摸象”,以经验和人工为主要手段,问题出现后,各运维岗通常自扫门前雪。“盲人摸象”式的传统运维,其实一直是业务系统稳定运行的隐患。传统IT运维往往被当作“背锅侠”,很多企业的系统出现故障,板子总是第一时间落在运维部门身上。


其实,伴随着行业数字化转型的深入,企业的应用系统越来越多,越来越复杂,传统的IT系统与运维方式已不能适应新需求的变化。要让运维产生更多价值,让企业不再受到人员和经验的局限,智能运维成为了公认的发展方向。


1 系统复杂性难题,智能运维应运而生


运维诞生于最早的信息化时代。在信息化时代,企业的信息化系统,主要是为了满足企业内部管理的需求。通常是集中、可控和固化的烟囱式架构。传统IT运维,以人力运维为主,在单点式和烟囱式的架构中,的确起到了非常重要的作用。在这种背景下发展出来的IT运维,其实也只是解决了单台IT设备的故障率或单套应用系统的可用性。所以当业务系统发生故障时,首先由各个运维岗位对各自负责的设备、应用组件、系统进行自检。期间还会召集硬件设备提供商、软件系统开发商、集成商等众多服务商进行“会诊”,整个流程拖沓而漫长。但进入到云计算时代之后,IT的边界被完全打开,面对更多的联接、更多的设备、云化的系统和应用,以及庞大的分布式系统,传统运维明显已经无法应对如此复杂的IT环境。新华三集团副总裁、技术服务部总裁毕首文表示,“在客户的传统观念里,大量的财力、物力和人力都投入到IT基础设施建设,运维并没有得到更多的重视,但随着以运营商和金融客户为代表的业务复杂性越来越高,要服务的客户诉求越来越细化,要求IT系统在短周期内频繁地优化,这对运维能力提出了极高的要求。”

新华三集团副总裁、技术服务部总裁毕首文

伴随这种系统复杂性的提升,企业又同时面对着运维人才缺失的鸿沟。因此,智能运维模式应运而生。实际上,智能运维也不是一蹴而就,在传统运维的发展历程中,还存在自动化运维等中间阶段的概念。毕首文指出,“自动化运维,只是对传统人力叠加运维模式的升级,是利用工具来做运维的推进和演进,它优化了传统运维,但没有脱离传统运维的范畴。但智能运维强调的是AI赋能,是把数据的能力、AI的能力与场景结合,已经是一种业务的创新和运维思维方式的改变。”


2 从运维到运营,背后是业务视角驱动


严格地说,数字化运维的发展过程,主要是分析决策步骤发生了变化,开始时由人工决策分析,其后是使用自动化的脚本进行基于规则的决策。而今天的智能运维,则是用机器学习方法做决策分析,这是智能运维本质上的不同。智能运维对运维部门的改变是天翻地覆的。传统运维是低门槛的手工作业,而智能运维需要开发数据采集程序,搭建大数据基础架构,和高效的机器学习算法,这也将推动智能运维成为企业重要的IT投入之一。


Gartner的报告显示:智能运维相关的技术产业处于上升期,2016年,AIOps的部署率低于5%,而到2019年,AIOps的全球部署率就已经高达25%,可见其飞速的发展势头。毕首文表示,推动智能运维的关键因素有两点,第一是技术发展趋势的必然性,第二是客户诉求的不断进化。随着业务复杂性越来越高,客户IT建设过程中完全脱离过去简单的基础架构建设,客户要驾驭整体IT架构,从业务运营到底层架构的难度非常大,所以对智能运维来说是利好的机会。“现阶段,智能运维已经进入到高速发展的蓄力期,而到2025年智能运维会迎来爆发性的增长状态。” 毕首文说。实际上,新华三也在自身的数字化探索中,预见了智能运维的发展。从企业内部来讲, IT早期会更多地关注基础设施建设,对于业务的耦合度或者关联性关注度不够。2016年,新华三将数字化转型确立为集团发展的核心战略,在改造过程中不仅仅是对于IT系统性的流程优化,更多是对整个系统进行流程再造,来保证对上层业务的支撑。这种“再造”,已不仅仅是为了系统建好后去做运维,而是从业务角度出发,推动业务健康发展,按照毕首文的理解,“这就是从传统的运维模式上,向业务应用的方向渗透,并为整个业务的发展提供运营支撑。”诚如此言,运维更多是被动式“维持”,而运营更多是主动式“经营”;运维更多是面向基础设施面向软硬件,运营更多是面向业务面向服务面向人;运维的关键词是“稳定”、“安全”、“可靠”,运营的关键词是“体验”、“效率”、“效益”。运维的未来就是运营,而唯有提升到运营的层次,才能够真正意义上支撑业务应用的创新。新华三明显深谙此道,并通过自身的实践与经验,推出智能运维的工具与服务,全面赋能企业业务的数字化创新。


3 做智能运维的推动者和引领者


传统运维的业务价值是为了让系统“活着”,智能运维则是为了让系统“活”更好,活出精彩。


首先,从传统运维向智能运维转变的过程中,平台是实现数据的融合和智能化变革最重要的基础,而新华三的U-Center平台,就是智能运维的基础性平台。U-Center平台以智能为核心,推动云上云下运维快速协同,重塑各个业务单元的智能化交付能力,提供全场景、全生命周期AI融合运维,打造全方位、多样化的运维服务能力,实现从数字化、自动化到智能化、云化的运维能力提升,更好地支撑业务价值转化。如毕首文所说,U-Center平台还具备几点关键优势:首先U-Center是基于开放性的容器底座,又是一个全域融合的底座,通过IT资源的配置管理,实现了从系统架构到上层应用的全方位智能化的变革与改造;另外U-Center是基于应用视角,具备快速的敏捷交付能力。的确,一方面U-Center可以提供面向业务敏捷的自动化运维管理。减少人工操作,将重复的操作集市化,将集市化的跨平台操作场景化,可以最大化地释放运维生产力;另一方面,U-Center以AI赋能运维管理,旨在摸清数据资产,落地数据治理,理清数据链路,做好数据监测,大幅提高故障处理效率。这将带给客户智能运维更优质的应用体验。其次,在智能运维的工具层面,新华三也是百花齐放。比如2021年新华三推出的“金手指”智能工具集,可以为客户提供端到端、全生命周期的运维服务,比如ICT巡检工具已累计覆盖超过12万台设备,帮助用户提前发现超过10万个隐患,通过提前消除潜在风险,全面守护数字化转型的“安全感”。再有2020年推出的iService服务数字中枢。iService可通过对海量数据的智能关联,有效发现潜在危机,让运维化被动响应为主动服务。目前,iService已累计纳管设备超过65万+台,为5000+用户提供7万+次巡检服务。当然还有新华三知了社区当中的问答AI机器人“吱吱纳秒答”,可实现瞬时回复和深度学习,回答准确率高达82%,年交互量达10万+,为用户节省了宝贵的搜寻和提问时间。第三,新华三还在积极参与智能运维各项行业标准的制定。智能运维要成为主流的IT建设方案,服务更广大的用户群,就需要各相关细分领域的企业群策群力,因此,新华三参与了智能运维国家标准的编制工作。“制定智能运维国标,新华三是重要的参与者之一,在智能运维的标准化制定,和推动智能运维的业务发展上,新华三其实都是一个非常重要的推动者和引领者。”毕首文说。

相关文章
|
1天前
|
机器学习/深度学习 运维 数据挖掘
智能化运维:利用机器学习优化数据中心
【6月更文挑战第28天】本文将探讨如何通过机器学习技术来优化数据中心的运维工作。我们将首先介绍机器学习的基本原理,然后详细讨论其在数据中心运维中的应用,包括故障预测、性能优化和自动化运维等。最后,我们将通过一个实际案例来展示机器学习在数据中心运维中的实际效果。
|
1天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI在IT管理中的应用与挑战
【6月更文挑战第28天】随着人工智能技术的飞速发展,其在IT运维领域的应用逐渐深入。本文将探讨AI技术在智能化运维中的角色,包括自动化故障诊断、预测性维护、以及安全监控等方面。同时,我们也将分析实施智能化运维时面临的技术挑战和伦理问题,旨在为读者提供一个关于如何有效整合AI技术进入IT运维实践的全面视角。
|
5天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI在IT基础设施管理中的应用
【6月更文挑战第24天】本文将深入探讨人工智能(AI)如何革新传统IT运维模式,提升效率与响应速度。通过分析AI技术在故障预测、自动化处理和安全防护等方面的应用实例,揭示其对现代IT基础设施管理的深远影响。文章旨在为读者提供一个关于AI赋能运维领域的全面视角,同时指出实施过程中可能遇到的挑战与对策。
31 5
|
3天前
|
机器学习/深度学习 运维 资源调度
智能化运维:机器学习在故障预测中的应用
【6月更文挑战第26天】本文旨在探讨机器学习技术如何革新传统的IT运维模式,特别是在故障预测领域的应用。文章将介绍机器学习的基本原理,分析其在故障预测中的优势,并通过案例研究展示机器学习模型如何提高运维效率和减少系统停机时间。最后,我们将讨论实施智能化运维时可能遇到的挑战及相应的解决策略。
|
8天前
|
人工智能 运维 监控
智能化运维:AI在IT运维中的应用与挑战
【6月更文挑战第21天】本文将深入探讨AI技术如何革新传统的IT运维领域,通过案例分析展示AI在故障预测、自动化处理和安全监控等方面的应用。同时,文章也将讨论AI运维带来的挑战,包括数据隐私、系统复杂性和成本问题,并提出相应的解决策略。
192 6
|
6天前
|
弹性计算 人工智能 运维
体验评测报告:阿里云OS Copilot——智能运维的革新之旅
体验评测报告:阿里云OS Copilot——智能运维的革新之旅
248 3
|
8天前
|
机器学习/深度学习 人工智能 运维
智能化运维的崛起:AI在IT管理中的应用与挑战
【6月更文挑战第21天】随着人工智能(AI)技术的飞速发展,其在信息技术(IT)运维领域的应用已成为推动效率和创新的关键动力。本文将深入探讨AI如何重塑IT运维的面貌,包括自动化故障检测、预测性维护、以及智能决策支持等方面。同时,我们也将分析在实施智能化运维时所面临的技术挑战和道德考量,并提出相应的解决策略。
311 4
|
8天前
|
机器学习/深度学习 人工智能 运维
智能化运维的探索与实践
【6月更文挑战第21天】本文旨在探讨智能化运维在现代IT管理中的应用和挑战,通过分析智能化技术如何赋能传统运维流程,揭示其在提升效率、降低成本方面的潜力。文章将结合具体案例,阐述智能化运维的实施路径和面临的主要问题,为读者提供一套可行的智能化运维解决方案框架。
|
1天前
|
机器学习/深度学习 运维 算法
智能运维的崛起:机器学习在IT管理中的应用与挑战
随着企业对信息技术依赖程度的不断加深,传统的运维模式已经难以满足现代业务的需求。本文将深入探讨如何通过机器学习技术提升运维效率,分析其在故障预测、自动化处理和安全防护等方面的应用,并讨论实施过程中可能遇到的技术与管理挑战。文章旨在为IT专业人士提供一种前瞻性的视角,以适应日益复杂的运维环境。
6 0
|
1天前
|
机器学习/深度学习 数据采集 运维
智能运维的崛起:机器学习在故障预测中的应用
随着信息技术的迅猛发展,企业对IT系统的稳定性和可靠性要求日益提高。传统的运维模式已难以满足现代业务需求,智能运维(AIOps)应运而生。本文将深入探讨机器学习技术如何赋能运维领域,特别是在故障预测方面的应用。文章首先概述了智能运维的概念及其重要性,随后详细分析了机器学习在故障预测中的作用机制,包括数据收集、特征工程、模型选择与训练等关键步骤,并结合实际案例展示了机器学习模型的预测效果。最后,讨论了实施智能运维时面临的挑战及应对策略,旨在为读者提供一套完整的智能运维解决方案框架。
7 0

热门文章

最新文章