新华三:智能运维的洞见与预见

简介: 新华三:智能运维的洞见与预见

运维无小事,它是企业IT系统解决各种不确定性风险的“灭火员”。

但传统运维又像是“盲人摸象”,以经验和人工为主要手段,问题出现后,各运维岗通常自扫门前雪。“盲人摸象”式的传统运维,其实一直是业务系统稳定运行的隐患。传统IT运维往往被当作“背锅侠”,很多企业的系统出现故障,板子总是第一时间落在运维部门身上。


其实,伴随着行业数字化转型的深入,企业的应用系统越来越多,越来越复杂,传统的IT系统与运维方式已不能适应新需求的变化。要让运维产生更多价值,让企业不再受到人员和经验的局限,智能运维成为了公认的发展方向。


1 系统复杂性难题,智能运维应运而生


运维诞生于最早的信息化时代。在信息化时代,企业的信息化系统,主要是为了满足企业内部管理的需求。通常是集中、可控和固化的烟囱式架构。传统IT运维,以人力运维为主,在单点式和烟囱式的架构中,的确起到了非常重要的作用。在这种背景下发展出来的IT运维,其实也只是解决了单台IT设备的故障率或单套应用系统的可用性。所以当业务系统发生故障时,首先由各个运维岗位对各自负责的设备、应用组件、系统进行自检。期间还会召集硬件设备提供商、软件系统开发商、集成商等众多服务商进行“会诊”,整个流程拖沓而漫长。但进入到云计算时代之后,IT的边界被完全打开,面对更多的联接、更多的设备、云化的系统和应用,以及庞大的分布式系统,传统运维明显已经无法应对如此复杂的IT环境。新华三集团副总裁、技术服务部总裁毕首文表示,“在客户的传统观念里,大量的财力、物力和人力都投入到IT基础设施建设,运维并没有得到更多的重视,但随着以运营商和金融客户为代表的业务复杂性越来越高,要服务的客户诉求越来越细化,要求IT系统在短周期内频繁地优化,这对运维能力提出了极高的要求。”

新华三集团副总裁、技术服务部总裁毕首文

伴随这种系统复杂性的提升,企业又同时面对着运维人才缺失的鸿沟。因此,智能运维模式应运而生。实际上,智能运维也不是一蹴而就,在传统运维的发展历程中,还存在自动化运维等中间阶段的概念。毕首文指出,“自动化运维,只是对传统人力叠加运维模式的升级,是利用工具来做运维的推进和演进,它优化了传统运维,但没有脱离传统运维的范畴。但智能运维强调的是AI赋能,是把数据的能力、AI的能力与场景结合,已经是一种业务的创新和运维思维方式的改变。”


2 从运维到运营,背后是业务视角驱动


严格地说,数字化运维的发展过程,主要是分析决策步骤发生了变化,开始时由人工决策分析,其后是使用自动化的脚本进行基于规则的决策。而今天的智能运维,则是用机器学习方法做决策分析,这是智能运维本质上的不同。智能运维对运维部门的改变是天翻地覆的。传统运维是低门槛的手工作业,而智能运维需要开发数据采集程序,搭建大数据基础架构,和高效的机器学习算法,这也将推动智能运维成为企业重要的IT投入之一。


Gartner的报告显示:智能运维相关的技术产业处于上升期,2016年,AIOps的部署率低于5%,而到2019年,AIOps的全球部署率就已经高达25%,可见其飞速的发展势头。毕首文表示,推动智能运维的关键因素有两点,第一是技术发展趋势的必然性,第二是客户诉求的不断进化。随着业务复杂性越来越高,客户IT建设过程中完全脱离过去简单的基础架构建设,客户要驾驭整体IT架构,从业务运营到底层架构的难度非常大,所以对智能运维来说是利好的机会。“现阶段,智能运维已经进入到高速发展的蓄力期,而到2025年智能运维会迎来爆发性的增长状态。” 毕首文说。实际上,新华三也在自身的数字化探索中,预见了智能运维的发展。从企业内部来讲, IT早期会更多地关注基础设施建设,对于业务的耦合度或者关联性关注度不够。2016年,新华三将数字化转型确立为集团发展的核心战略,在改造过程中不仅仅是对于IT系统性的流程优化,更多是对整个系统进行流程再造,来保证对上层业务的支撑。这种“再造”,已不仅仅是为了系统建好后去做运维,而是从业务角度出发,推动业务健康发展,按照毕首文的理解,“这就是从传统的运维模式上,向业务应用的方向渗透,并为整个业务的发展提供运营支撑。”诚如此言,运维更多是被动式“维持”,而运营更多是主动式“经营”;运维更多是面向基础设施面向软硬件,运营更多是面向业务面向服务面向人;运维的关键词是“稳定”、“安全”、“可靠”,运营的关键词是“体验”、“效率”、“效益”。运维的未来就是运营,而唯有提升到运营的层次,才能够真正意义上支撑业务应用的创新。新华三明显深谙此道,并通过自身的实践与经验,推出智能运维的工具与服务,全面赋能企业业务的数字化创新。


3 做智能运维的推动者和引领者


传统运维的业务价值是为了让系统“活着”,智能运维则是为了让系统“活”更好,活出精彩。


首先,从传统运维向智能运维转变的过程中,平台是实现数据的融合和智能化变革最重要的基础,而新华三的U-Center平台,就是智能运维的基础性平台。U-Center平台以智能为核心,推动云上云下运维快速协同,重塑各个业务单元的智能化交付能力,提供全场景、全生命周期AI融合运维,打造全方位、多样化的运维服务能力,实现从数字化、自动化到智能化、云化的运维能力提升,更好地支撑业务价值转化。如毕首文所说,U-Center平台还具备几点关键优势:首先U-Center是基于开放性的容器底座,又是一个全域融合的底座,通过IT资源的配置管理,实现了从系统架构到上层应用的全方位智能化的变革与改造;另外U-Center是基于应用视角,具备快速的敏捷交付能力。的确,一方面U-Center可以提供面向业务敏捷的自动化运维管理。减少人工操作,将重复的操作集市化,将集市化的跨平台操作场景化,可以最大化地释放运维生产力;另一方面,U-Center以AI赋能运维管理,旨在摸清数据资产,落地数据治理,理清数据链路,做好数据监测,大幅提高故障处理效率。这将带给客户智能运维更优质的应用体验。其次,在智能运维的工具层面,新华三也是百花齐放。比如2021年新华三推出的“金手指”智能工具集,可以为客户提供端到端、全生命周期的运维服务,比如ICT巡检工具已累计覆盖超过12万台设备,帮助用户提前发现超过10万个隐患,通过提前消除潜在风险,全面守护数字化转型的“安全感”。再有2020年推出的iService服务数字中枢。iService可通过对海量数据的智能关联,有效发现潜在危机,让运维化被动响应为主动服务。目前,iService已累计纳管设备超过65万+台,为5000+用户提供7万+次巡检服务。当然还有新华三知了社区当中的问答AI机器人“吱吱纳秒答”,可实现瞬时回复和深度学习,回答准确率高达82%,年交互量达10万+,为用户节省了宝贵的搜寻和提问时间。第三,新华三还在积极参与智能运维各项行业标准的制定。智能运维要成为主流的IT建设方案,服务更广大的用户群,就需要各相关细分领域的企业群策群力,因此,新华三参与了智能运维国家标准的编制工作。“制定智能运维国标,新华三是重要的参与者之一,在智能运维的标准化制定,和推动智能运维的业务发展上,新华三其实都是一个非常重要的推动者和引领者。”毕首文说。

相关文章
|
1天前
|
机器学习/深度学习 人工智能 资源调度
基于AI的运维资源调度:效率与智能的双重提升
基于AI的运维资源调度:效率与智能的双重提升
29 16
基于AI的运维资源调度:效率与智能的双重提升
|
3天前
|
人工智能 运维 Kubernetes
阿里云容器服务AI助手2.0 - 新一代容器智能运维能力
2024年11月,阿里云容器服务团队进一步深度融合现有运维可观测体系,在场景上覆盖了K8s用户的全生命周期,正式推出升级版AI助手2.0,旨在更好地为用户使用和运维K8S保驾护航。
|
27天前
|
机器学习/深度学习 人工智能 运维
人工智能在云计算中的运维优化:智能化的新时代
人工智能在云计算中的运维优化:智能化的新时代
128 49
|
21天前
|
存储 分布式计算 Hadoop
【产品升级】Dataphin V4.4重磅发布:开发运维提效、指标全生命周期管理、智能元数据生成再升级
Dataphin V4.4版本引入了多项核心升级,包括级联发布、元数据采集扩展、数据源指标上架、自定义属性管理等功能,大幅提升数据处理与资产管理效率。此外,还支持Hadoop集群管理、跨Schema数据读取、实时集成目标端支持Hudi及MaxCompute delta等技术,进一步优化用户体验。
333 3
【产品升级】Dataphin V4.4重磅发布:开发运维提效、指标全生命周期管理、智能元数据生成再升级
|
11天前
|
数据采集 机器学习/深度学习 人工智能
基于AI的网络流量分析:构建智能化运维体系
基于AI的网络流量分析:构建智能化运维体系
73 13
|
18天前
|
机器学习/深度学习 数据采集 运维
机器学习在运维中的实时分析应用:新时代的智能运维
机器学习在运维中的实时分析应用:新时代的智能运维
72 12
|
28天前
|
人工智能 运维 自然语言处理
智能化运维:AI在IT运维领域的深度应用与实践####
本文探讨了人工智能(AI)技术在IT运维领域的深度融合与实践应用,通过分析AI驱动的自动化监控、故障预测与诊断、容量规划及智能决策支持等关键方面,揭示了AI如何赋能IT运维,提升效率、降低成本并增强系统稳定性。文章旨在为读者提供一个关于AI在现代IT运维中应用的全面视角,展示其实际价值与未来发展趋势。 ####
156 4
|
30天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
27天前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术在现代数据中心管理中的实际应用,分析了其带来的效率提升、成本节约及潜在风险。通过具体案例,阐述了智能监控、自动化故障排查、容量规划等关键功能如何助力企业实现高效稳定的IT环境。同时,文章也指出了实施过程中面临的数据隐私、技术整合及人才短缺等挑战,并提出了相应的解决策略。 --- ####
48 1
|
1月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在企业IT管理中的应用与实践####
本文深入探讨了智能化运维(AIOps)的核心技术原理,通过对比传统运维模式,揭示了AIOps如何利用大数据、机器学习等先进技术提升故障预测准确性、优化资源分配及自动化处理流程。同时,文章详细阐述了智能化运维平台的实施步骤,包括数据收集与分析、模型训练与部署、以及持续监控与优化,旨在为企业IT部门提供一套切实可行的智能化转型路径。最后,通过几个典型应用案例,如某大型电商平台的智能告警系统和金融企业的自动化故障排查流程,直观展示了智能化运维在实际业务场景中的显著成效,强调了其在提升运维效率、降低运营成本方面的关键作用。 ####
50 4

热门文章

最新文章