行业数字化转型呼唤IT运维管理智能化、敏捷化

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
应用实时监控服务-应用监控,每月50GB免费额度
日志服务 SLS,月写入数据量 50GB 1个月
简介: 现阶段金融行业正处在向互联网业务转型的关键时期,金融机构越来越将业务数据视为一项重要的资产,从而更加关注与数据资产相关的运维管理。而 IT 系统规模扩大、业务复杂化以及功能性增加,让金融机构对 ITOM/ITOA 产品的需求趋于 多样化,预期市场增量将主要来自 IT 系统老旧替换和新的功能性带来的 IT 运维需求

ITOM/ITOA 概述

ITOM(IT Operations Management, IT 运维管理)是指运用工具软件对 IT 基础设施以及应用软件等对象进行实时监控管理并提供反馈,为监测对象保持最佳运行状态提供保障。 目前市场上的 ITOM 产品主要分为监控、管理和自动化三种类型。监控类包含基础设施监控、 应用性能管理(APM)、网络性能管理(NPM)、大型机性能监控,其中面向 IT 基础设施的监控最为成熟;管理类包括IT资产和财务管理、IT服务支持管理和其他IT运维管理,如各 种ITSM系统和CMDB软件系统;IT运维自动化主要指自动化运维工具,如开源的Ansible、 Puppet 等。

ITOA(IT Operations Analytics,IT 运维分析)是指运用大数据和机器学习等手段,通 过收集、处理和分析运维数据,识别 IT 系统中潜在的风险和问题,协助企业进行更有效的业 务决策。目前 ITOA 有五类主要的数据源:第一类是机器数据,利用服务器、网络设备等产 生的日志进行分析,包括日志数据、调用关系数据、业务运营数据等,该类数据的应用目前 在国内相对活跃;第二类是通信数据,通过网络抓包进行使用分析;第三类是代理数据, 在.NET、PHP、Java 字节码里插入代理程序,从字节码里统计函数调用、堆栈使用等信息, 进行代码级别的监控;第四类是探针数据,即布点拨测,在各地模拟 ICMP ping、HTTP GET 请求;第五类是指标采集数据,主要是监控采集到的数据库、主机、应用等运行状态及指标 数据,包括设备运行数据、物理关系数据等。ITOA 在使用不同的数据源时需要对数据进行关 联,因此 ITOA 适用于数据基础好、IT 成熟度较高的行业,如电信、金融、电力、交通等。

传统的 ITOM 体系能够采集到运维数据并将自动化带到运维当中,让 IT 运维更加高效, 但往往缺乏分析能力,无法洞察这些数据所包含的信息,ITOA 作为 ITOM 行业中新兴的细 分市场,更注重数据价值的挖掘与传递,能够有效解决监控数据孤岛问题,实现监控工具、 监控数据的价值优化。但是,ITOA 与传统的 IT 运维管理间的关系并非是割裂的,相反的, 企业进行大数据分析所需要的数据正是来源于原有的 IT 运维系统,即 ITOA 必须建立在传统 运维的基础之上,两者的发展应当是相辅相成的。随着大数据和人工智能技术的成熟,海量 运维数据的分析成为了可能。ITOA 基于高性能大数据引擎和智能分析算法,全面掌控数字化 运营状态,帮助管理人员清晰直观地了解业务运营与 IT 运维中的有效信息,能够实现业务运 营与 IT 运维的有效协同,提升资产管理与监控管理的效率。

**中国 ITOM/ITOA 发展历程
**
在信息化发展初期,企业级 IT 系统规模较小且业务和系统架构简单, IT 运维管理主要 以面向机房、服务器、监控管理等底层的基础架构为目标,作为保障业务顺利进行的辅助手 段为企业产生间接的业务价值。在此阶段,IT 运维管理技术应用相对单一,运维工具尚未出 现。企业运维水平往往依赖于团队中核心运维人员的知识经验。随着信息化的深入,传统运 维方式难以满足企业信息系统规模逐渐扩大、业务量迅速增长的需求,此时,运维标准化和 中国 IT 基础架构运维市场研效率提升成为新的发展方向,ITIL(Information Technology Infrastructure Library, IT 基 础架构库)等标准的运用,使得 IT 运维管理的重点从网络系统管理转向业务服务管理。 随着云计算和大数据等技术的发展和应用,企业的 IT 基础架构逐渐从原来的单一 IOE 架 构向 x86、云化、开源分布式架构转变。这一阶段伴随着基础架构的革新,IT 运维管理更加 强调按需应变,敏捷响应业务需求,ITOM 行业因此开始从稳态向敏捷态倾斜。企业产品迭 代速度加快,业务复杂度提升,关注开发运维一体化的 DevOps 概念开始盛行。DevOps 理 念的落地不仅有效缩短了产品的开发周期,更促进 ITOM 向自动化运维迈进。与此同时,IT 系统复杂度提升、数据量激增、分布式架构等因素促使 IT 运维管理由事后处理向以运维分析 为主的 ITOA 升级,2012 年全球首家 ITOA 公司 Splunk 上市成为 ITOA 发展史上里程碑的事件。

0d3a754d91abf95a15d721e07d3e4578.jpg

ITIL 标准问世后,“四大国际巨头”即 IBM、HP、BMC 和 CA 便推出了 IT 服务管理软件和实施方案,占据市场先机。相比国际巨头聚焦高端客户群体,国内厂商在解决方案和实施落地方面具有优势,多集中在长尾市场中服务于大量的中小型企业。当前,国内 DevOps、 自动化运维领域的厂商正积极运用新的运维技术和理念提升自身能力,集中向 AIOps 即智能运维方向发展。

中国 ITOM/ITOA 市场竞争情况

从历史来看,“四大国际巨头”的产品覆盖细分领域比较全面,在中国的 ITOM 领域占有 大部分的市场份额。随着互联网和移动互联网的发展,应用程序开发和部署发生了巨大变化, 应用变得越来越分布式和分散化,“四大国际巨头”的产品因而显得更为笨重。在国际市场上, 尽管“四大国际巨头”在某些细分领域已经逐渐被以 New Relic、ServiceNow 等新兴创业 公司所超越,但是在中国市场依然占据主流地位。中国的 ITOM/ITOA 行业是一个相对碎片化的市场,运维服务商注重提供整体解决方案,而产品型厂商大多在业务布局中各有侧重。

在中国的 ITOM 市场,IBM 和 HP 占据基础设施监控领域的主流,尤其是在以金融行业为代表的头部市场。国内厂商主要以两种形态存在,一种是广通信达、北塔软件等独立软件厂商,另一种是偏向于运维服务的厂商,其中亿阳信通和神州泰岳侧重在电信运营商的网管系统领域。NPM 领域相对封闭且份额较小,国内厂商中领先的玩家包括上海天旦网络、华青融天,功能偏向于业务流程可视化。大型机性能监控的门槛较高,目前依然被 IBM 和 CA 所 垄断。在应用性能管理领域,国内玩家主要以中小创业公司为主,如基调网络、云智慧、博睿宏远、蓝海讯通等,均有从 ITOM 向 ITOA 转型的趋势。

9decb81defc0ba56ff44e923bc66bd94.jpg

ITOM 市场目前已相对成熟,进入稳步发展阶段。2019 年 ITOM 整体市场规模达到 110.4 亿元,2014-2019 年的年复合增长率为 14.5%。其中,ITOA 市场规模为 14.9 亿元,同比增长 29.1%。ITOA 市场虽然当前体量较小,但是增长潜力大,2014-2019 年的年复合增长率 达到 47.3%。

ITOM 市场规模的增长主要来自于两方面,一个是 IT 运维体系内部的迭代升级,另一个是行业渗透率的提高。IT 运维涉及应用企业的核心数据,所以客户流失率低,续签率稳定, 在迭代过程中客户关系相对稳定。目前在 ITOM 市场方面,大型企业对 ITOM 投入较多,且 自动化类产品比例逐渐增加,而随着 IT 运维的价值日渐受到重视,交通、政府等市场份额占 比较低的行业会为 ITOM 提供新的增量空间。同时,系统复杂度与业务需求多样化等新的变 化成为我国 ITOM 发展的重要驱动力。 ITOA 是在 ITOM 的基础上发展起来的可以协助决策、提高效率的一种具有价值的工具。 但是目前 ITOA 在中国依然是一个新兴的市场,大部分企业对于 IT 运维管理的需求还没有上 升到数据分析的层面,整体市场格局还没有形成。不过国内领先的 IT 运维厂商已经认识到 ITOA 将会是未来运维领域的新趋势,基本都在同具有密切合作关系的客户在 ITOA 领域进行 尝试和探索,尤其是金融行业对 ITOA 的反馈最为积极。随着大数据、云计算在各行各业的 落地应用,越来越多的可量化指标围绕 IT 运营,将 ITOA 应用到客户环境中,企业可以从数 据中挖掘出关键信息,从中挖掘出关键洞察力,以及具备跨基础设施自动执行操作任务的能 力,从而提高其组织的竞争优势开启数字化转型之旅。

中国 ITOM/ITOA 发展趋势

国内 ITOM 产业正迎来结构性变革,预计在未来五年内,中国 ITOM 市场基本维持当前 的增长态势,到 2023 年市场规模将达到 165.7 亿元,2020-2023 年的年复合增长率为 10.7%。 与整体 ITOM 市场相比,ITOA 市场规模的增长将会非常迅速。随着 ITOA 在各行各业渗透率 的提高,ITOA 市场将会保持 22.9%的年复合增长率,预计到 2023 年中国 ITOA 的市场规模 将达到 34.0 亿元。

ITOM 运维发展方向:从 ITIL 向 DevOps 发展

ITIL 为企业的 IT 服务管理提供了一个客观、严谨、可量化的最佳实践标准和规范。在 IOE 技术架构的年代,以 ITIL 理念为为核心的各种 ITSM 系统将运维操作流程化、规范化、分工化。 这种集中式的技术架构结构相对简单,运维操作稳妥,但是无法满足企业对于按需应变、敏 捷响应的业务需求。DevOps 以自动化工具下高效率的自动化操作代替冗长流程控制下的规 范性,更适合现代化企业的开发运维需求。需要注意的是,ITIL 体系并未完全过时,企业需 要将 ITIL 和 DevOps 与自身开发运维的特点相结合。考虑到传统企业的转型过程是从建设思 路、技术落地到敏捷运维的演进,ITOM 厂商既要充分利用好原有基础设施以保持稳定服务, 也应当通过 DevOps 体系满足客户不断迸发的新业务需求。

ITOM 运维发展方向:从 ITOM 到 AIOps 发展

当前互联网和移动互联网发展迅猛,为了更好应对激烈的市场竞争,越来越多的企业开 始利用云计算及大数据等新兴信息技术进行数字化转型,国内 IT 产业也面临包括系统架构复 杂化、运维数据多维化、用户需求多样化等变革。面对这些新形势下的挑战, ITOM 需要从 原有的人工加被动响应,转变为更加自动、高效的智能运维即 AIOps。AIOps 的定义涵盖的 两个阶段,第一阶段是数据到信息分析层次的提升;第二阶段是信息到知识提取层次的提升。 从数据到信息的分析,更多的是采用数据统计方法,帮助运维相关人员更好地从众多运维数 据中了解系统的运行状态,分析并定位故障,实时获取统计数据。从信息到知识的提升更多 的是希望借助人工智能算法,在信息分析的基础上通过机器学习的方式实现异常状况检测、 故障/趋势分析、故障关联和精准告警。 AIOps 构建在传统 ITOM 之上,把 ITOM 作为分析的源头,通过接口集成将各 ITOM 组 件中的孤立运维数据进行汇总,再借助自身的关联分析、机器学习、数据建模、全局搜索能 力,帮助企业趋势预判、快速故障定位和商业洞察等价值。在大数据和人工智能运维场景下 进行的性能分析、潜在故障挖掘和根因识别定位,都将超过人工运维的判断准确性,会是未 来 ITOM 的重要发展方向。

ITOA 市场发展方向:数据维度多样

ITOA 通过收集、处理和分析运维数据协助企业进行有效决策。数据接入能力是 ITOA 厂 商的关键竞争要素,数据采集全面、数据库先进安全、数据维度来源多样化决定了 ITOA 产品的性能和速度。当前的 ITOA 市场主要集中于日志分析和搜索,日志处理能力的增强使得 可利用的数据范围变得更加广泛,沉积在 IT 系统中的大量历史数据将可以发挥他们的价值。 虽然目前的日志分析多专注于日志数据,但通过将日志数据与面向最终用户、基础设施和应 用性能的数据相结合,ITOA 通过数据维度多样化将可以实现全面的根因分析和主动的容量 优化。

ITOA 市场发展方向:平台模式输出

在商业模式的探索上,云计算技术的发展和落地也为 ITOA 带来了改变。尽管内部部署 和软件许可证的模式仍将占据 ITOA 市场中的主要部分,但是以平台模式进行交付的 ITOA 将会越来越多。同时,ITOA 行业局限性将被逐渐打破,ITOA 厂商会围绕行业特性进行不同定制需求的探索,主要围绕容量分析、故障分析、故障预测、风险控制和业务分析等多个方 面向更多行业和各类型的企业渗透。相对于 SaaS 模式在中国市场单一工具输出,平台型解决方案的模式在满足客户定制化需求上更具有优势,以模块化的产品组合解决客户定制化的需求,从而保证交付效率。

中国 ITOM/ITOA 应用领域

作为基础的运维工具,ITOM 下游客户分布广泛。其中应用领域最广泛是金融和电信, 除自研能力极强的中大型互联网公司,包括交通运输、政府、教育、医疗等在内的各个领域都存在 ITOM 的需求。金融行业正处于向互联网业务融合的时期,相比于其他行业,金融行业在 IT 运维管理方面呈现出系统规模大、业务复杂程度高的特性,且面临严格的金融监管要求,金融机构对实时性、稳定性、业务连续性的要求更高。随着网络软化及云计算、5G 等技 术的不断成熟,电信行业面临分工细化和网络转型的挑战,将有望通过智能化运维提升 IT 运 维效率、优化运维成本等。

政府机构对电子政务的建设和应用高度关注,发布了一系列政策推动电子政务的发展, 正在通过加大政务信息化建设力度,保障安全、稳定、高效的电子政务运行。制造业中,中大型企业对运维管理的需求更高,小型企业因为软硬件成本高、体能增效不明显等原因通常 应用 ITOM/ITOA 的比例较低。互联网企业具有业务迭代迅速、需求不断变化的特点,正在 通过对自动化、智能化的探索来代替 ITIL 标准下的传统运维。

814256b5788a0b2bfb21ff065cf5e64d.jpg

金融行业是 ITOM/ITOA 市场重点领域,银行业占金融行业的市场份额最大,其次为保 险业、证券业等其他细分领域的需求相对较小。2019 年中国金融行业 ITOM、ITOA 市场规 模分别为 30.8 亿元、5.1 亿元,其中银行业的占比为 70.9%、73.4%。预计未来四年内金融 行业在 ITOM 方面的投入将保持 11.5%的年复合增长率,到 2023 年市场规模将达到 43.6 亿元。

由于行业特殊性及政府监管要求,金融行业对数据私密性和安全性需求较高,尤其大型 金融机构会在生产系统之上搭建测试系统,业务应用上线前在测试系统中试运行,因此在测 试系统的运维监控上投入很大。现阶段金融行业正处在向互联网业务转型的关键时期,金融机构越来越将业务数据视为一项重要的资产,从而更加关注与数据资产相关的运维管理。而 IT 系统规模扩大、业务复杂化以及功能性增加,让金融机构对 ITOM/ITOA 产品的需求趋于 多样化,预期市场增量将主要来自 IT 系统老旧替换和新的功能性带来的 IT 运维需求。

银行业在 ITOM/ITOA 的需求上呈现逐步部署的特征,其中四大行的 IT 系统规模庞大, 具有内部研发和完整的实施能力,走在行业的应用前沿。随着传统银行业生态的重构,银行 机构内部对于 IT 建设的参与度大幅提升,四大行互联网银行、生物识别等新兴业务层出不穷, 既要依托于原有的 IT 基础架构建设,也会增加新的负载需求,带来 ITOM/ITOA 的增量空间。 大行主导的科技应用不断向整个行业蔓延,越来越多的银行开始关注并部署自动化、智能化 运维体系,中小城商行、农商行等对于 ITOM/ITOA 的投入较为薄弱,但是预计在政策的推 动下行业渗透率会逐渐增加。

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
相关文章
|
11天前
|
机器学习/深度学习 人工智能 运维
人工智能在云计算中的运维优化:智能化的新时代
人工智能在云计算中的运维优化:智能化的新时代
100 49
|
5天前
|
存储 分布式计算 Hadoop
【产品升级】Dataphin V4.4重磅发布:开发运维提效、指标全生命周期管理、智能元数据生成再升级
Dataphin V4.4版本引入了多项核心升级,包括级联发布、元数据采集扩展、数据源指标上架、自定义属性管理等功能,大幅提升数据处理与资产管理效率。此外,还支持Hadoop集群管理、跨Schema数据读取、实时集成目标端支持Hudi及MaxCompute delta等技术,进一步优化用户体验。
105 3
【产品升级】Dataphin V4.4重磅发布:开发运维提效、指标全生命周期管理、智能元数据生成再升级
|
2天前
|
机器学习/深度学习 数据采集 运维
机器学习在运维中的实时分析应用:新时代的智能运维
机器学习在运维中的实时分析应用:新时代的智能运维
25 12
|
12天前
|
人工智能 运维 自然语言处理
智能化运维:AI在IT运维领域的深度应用与实践####
本文探讨了人工智能(AI)技术在IT运维领域的深度融合与实践应用,通过分析AI驱动的自动化监控、故障预测与诊断、容量规划及智能决策支持等关键方面,揭示了AI如何赋能IT运维,提升效率、降低成本并增强系统稳定性。文章旨在为读者提供一个关于AI在现代IT运维中应用的全面视角,展示其实际价值与未来发展趋势。 ####
76 4
|
15天前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代IT系统中的应用与挑战####
本文探讨了智能化运维(AIOps)在现代IT系统中的关键作用及其面临的主要挑战。随着云计算、大数据和人工智能技术的飞速发展,传统的IT运维模式正逐渐向更加智能、自动化的方向转变。智能化运维通过集成机器学习算法、数据分析工具和自动化流程,显著提升了系统稳定性、故障响应速度和资源利用效率。然而,这一转型过程中也伴随着数据隐私、技术复杂性和人才短缺等问题。本文旨在为读者提供一个关于智能化运维的全面视角,分析其优势与挑战,并探讨未来的发展趋势。 ####
32 6
|
14天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
12天前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术在现代数据中心管理中的实际应用,分析了其带来的效率提升、成本节约及潜在风险。通过具体案例,阐述了智能监控、自动化故障排查、容量规划等关键功能如何助力企业实现高效稳定的IT环境。同时,文章也指出了实施过程中面临的数据隐私、技术整合及人才短缺等挑战,并提出了相应的解决策略。 --- ####
28 1
|
15天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在企业IT管理中的应用与实践####
本文深入探讨了智能化运维(AIOps)的核心技术原理,通过对比传统运维模式,揭示了AIOps如何利用大数据、机器学习等先进技术提升故障预测准确性、优化资源分配及自动化处理流程。同时,文章详细阐述了智能化运维平台的实施步骤,包括数据收集与分析、模型训练与部署、以及持续监控与优化,旨在为企业IT部门提供一套切实可行的智能化转型路径。最后,通过几个典型应用案例,如某大型电商平台的智能告警系统和金融企业的自动化故障排查流程,直观展示了智能化运维在实际业务场景中的显著成效,强调了其在提升运维效率、降低运营成本方面的关键作用。 ####
41 4
|
16天前
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。
40 4
|
17天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术如何革新现代数据中心的运维管理,通过集成人工智能、大数据分析及自动化工具,显著提升系统稳定性、效率和响应速度。文章首先概述了AIOps的核心概念与技术框架,随后详细分析了其在故障预测、异常检测、容量规划及事件响应等方面的应用实例,最后探讨了实施过程中面临的数据质量、技能匹配及安全性等挑战,并提出了相应的应对策略。本研究旨在为数据中心管理者提供关于采纳和优化AIOps实践的洞见,以期推动行业向更高效、智能的运维模式转型。 ####