行业数字化转型呼唤IT运维管理智能化、敏捷化

本文涉及的产品
应用实时监控服务-应用监控,每月50GB免费额度
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
日志服务 SLS,月写入数据量 50GB 1个月
简介: 现阶段金融行业正处在向互联网业务转型的关键时期,金融机构越来越将业务数据视为一项重要的资产,从而更加关注与数据资产相关的运维管理。而 IT 系统规模扩大、业务复杂化以及功能性增加,让金融机构对 ITOM/ITOA 产品的需求趋于 多样化,预期市场增量将主要来自 IT 系统老旧替换和新的功能性带来的 IT 运维需求

ITOM/ITOA 概述

ITOM(IT Operations Management, IT 运维管理)是指运用工具软件对 IT 基础设施以及应用软件等对象进行实时监控管理并提供反馈,为监测对象保持最佳运行状态提供保障。 目前市场上的 ITOM 产品主要分为监控、管理和自动化三种类型。监控类包含基础设施监控、 应用性能管理(APM)、网络性能管理(NPM)、大型机性能监控,其中面向 IT 基础设施的监控最为成熟;管理类包括IT资产和财务管理、IT服务支持管理和其他IT运维管理,如各 种ITSM系统和CMDB软件系统;IT运维自动化主要指自动化运维工具,如开源的Ansible、 Puppet 等。

ITOA(IT Operations Analytics,IT 运维分析)是指运用大数据和机器学习等手段,通 过收集、处理和分析运维数据,识别 IT 系统中潜在的风险和问题,协助企业进行更有效的业 务决策。目前 ITOA 有五类主要的数据源:第一类是机器数据,利用服务器、网络设备等产 生的日志进行分析,包括日志数据、调用关系数据、业务运营数据等,该类数据的应用目前 在国内相对活跃;第二类是通信数据,通过网络抓包进行使用分析;第三类是代理数据, 在.NET、PHP、Java 字节码里插入代理程序,从字节码里统计函数调用、堆栈使用等信息, 进行代码级别的监控;第四类是探针数据,即布点拨测,在各地模拟 ICMP ping、HTTP GET 请求;第五类是指标采集数据,主要是监控采集到的数据库、主机、应用等运行状态及指标 数据,包括设备运行数据、物理关系数据等。ITOA 在使用不同的数据源时需要对数据进行关 联,因此 ITOA 适用于数据基础好、IT 成熟度较高的行业,如电信、金融、电力、交通等。

传统的 ITOM 体系能够采集到运维数据并将自动化带到运维当中,让 IT 运维更加高效, 但往往缺乏分析能力,无法洞察这些数据所包含的信息,ITOA 作为 ITOM 行业中新兴的细 分市场,更注重数据价值的挖掘与传递,能够有效解决监控数据孤岛问题,实现监控工具、 监控数据的价值优化。但是,ITOA 与传统的 IT 运维管理间的关系并非是割裂的,相反的, 企业进行大数据分析所需要的数据正是来源于原有的 IT 运维系统,即 ITOA 必须建立在传统 运维的基础之上,两者的发展应当是相辅相成的。随着大数据和人工智能技术的成熟,海量 运维数据的分析成为了可能。ITOA 基于高性能大数据引擎和智能分析算法,全面掌控数字化 运营状态,帮助管理人员清晰直观地了解业务运营与 IT 运维中的有效信息,能够实现业务运 营与 IT 运维的有效协同,提升资产管理与监控管理的效率。

**中国 ITOM/ITOA 发展历程
**
在信息化发展初期,企业级 IT 系统规模较小且业务和系统架构简单, IT 运维管理主要 以面向机房、服务器、监控管理等底层的基础架构为目标,作为保障业务顺利进行的辅助手 段为企业产生间接的业务价值。在此阶段,IT 运维管理技术应用相对单一,运维工具尚未出 现。企业运维水平往往依赖于团队中核心运维人员的知识经验。随着信息化的深入,传统运 维方式难以满足企业信息系统规模逐渐扩大、业务量迅速增长的需求,此时,运维标准化和 中国 IT 基础架构运维市场研效率提升成为新的发展方向,ITIL(Information Technology Infrastructure Library, IT 基 础架构库)等标准的运用,使得 IT 运维管理的重点从网络系统管理转向业务服务管理。 随着云计算和大数据等技术的发展和应用,企业的 IT 基础架构逐渐从原来的单一 IOE 架 构向 x86、云化、开源分布式架构转变。这一阶段伴随着基础架构的革新,IT 运维管理更加 强调按需应变,敏捷响应业务需求,ITOM 行业因此开始从稳态向敏捷态倾斜。企业产品迭 代速度加快,业务复杂度提升,关注开发运维一体化的 DevOps 概念开始盛行。DevOps 理 念的落地不仅有效缩短了产品的开发周期,更促进 ITOM 向自动化运维迈进。与此同时,IT 系统复杂度提升、数据量激增、分布式架构等因素促使 IT 运维管理由事后处理向以运维分析 为主的 ITOA 升级,2012 年全球首家 ITOA 公司 Splunk 上市成为 ITOA 发展史上里程碑的事件。

0d3a754d91abf95a15d721e07d3e4578.jpg

ITIL 标准问世后,“四大国际巨头”即 IBM、HP、BMC 和 CA 便推出了 IT 服务管理软件和实施方案,占据市场先机。相比国际巨头聚焦高端客户群体,国内厂商在解决方案和实施落地方面具有优势,多集中在长尾市场中服务于大量的中小型企业。当前,国内 DevOps、 自动化运维领域的厂商正积极运用新的运维技术和理念提升自身能力,集中向 AIOps 即智能运维方向发展。

中国 ITOM/ITOA 市场竞争情况

从历史来看,“四大国际巨头”的产品覆盖细分领域比较全面,在中国的 ITOM 领域占有 大部分的市场份额。随着互联网和移动互联网的发展,应用程序开发和部署发生了巨大变化, 应用变得越来越分布式和分散化,“四大国际巨头”的产品因而显得更为笨重。在国际市场上, 尽管“四大国际巨头”在某些细分领域已经逐渐被以 New Relic、ServiceNow 等新兴创业 公司所超越,但是在中国市场依然占据主流地位。中国的 ITOM/ITOA 行业是一个相对碎片化的市场,运维服务商注重提供整体解决方案,而产品型厂商大多在业务布局中各有侧重。

在中国的 ITOM 市场,IBM 和 HP 占据基础设施监控领域的主流,尤其是在以金融行业为代表的头部市场。国内厂商主要以两种形态存在,一种是广通信达、北塔软件等独立软件厂商,另一种是偏向于运维服务的厂商,其中亿阳信通和神州泰岳侧重在电信运营商的网管系统领域。NPM 领域相对封闭且份额较小,国内厂商中领先的玩家包括上海天旦网络、华青融天,功能偏向于业务流程可视化。大型机性能监控的门槛较高,目前依然被 IBM 和 CA 所 垄断。在应用性能管理领域,国内玩家主要以中小创业公司为主,如基调网络、云智慧、博睿宏远、蓝海讯通等,均有从 ITOM 向 ITOA 转型的趋势。

9decb81defc0ba56ff44e923bc66bd94.jpg

ITOM 市场目前已相对成熟,进入稳步发展阶段。2019 年 ITOM 整体市场规模达到 110.4 亿元,2014-2019 年的年复合增长率为 14.5%。其中,ITOA 市场规模为 14.9 亿元,同比增长 29.1%。ITOA 市场虽然当前体量较小,但是增长潜力大,2014-2019 年的年复合增长率 达到 47.3%。

ITOM 市场规模的增长主要来自于两方面,一个是 IT 运维体系内部的迭代升级,另一个是行业渗透率的提高。IT 运维涉及应用企业的核心数据,所以客户流失率低,续签率稳定, 在迭代过程中客户关系相对稳定。目前在 ITOM 市场方面,大型企业对 ITOM 投入较多,且 自动化类产品比例逐渐增加,而随着 IT 运维的价值日渐受到重视,交通、政府等市场份额占 比较低的行业会为 ITOM 提供新的增量空间。同时,系统复杂度与业务需求多样化等新的变 化成为我国 ITOM 发展的重要驱动力。 ITOA 是在 ITOM 的基础上发展起来的可以协助决策、提高效率的一种具有价值的工具。 但是目前 ITOA 在中国依然是一个新兴的市场,大部分企业对于 IT 运维管理的需求还没有上 升到数据分析的层面,整体市场格局还没有形成。不过国内领先的 IT 运维厂商已经认识到 ITOA 将会是未来运维领域的新趋势,基本都在同具有密切合作关系的客户在 ITOA 领域进行 尝试和探索,尤其是金融行业对 ITOA 的反馈最为积极。随着大数据、云计算在各行各业的 落地应用,越来越多的可量化指标围绕 IT 运营,将 ITOA 应用到客户环境中,企业可以从数 据中挖掘出关键信息,从中挖掘出关键洞察力,以及具备跨基础设施自动执行操作任务的能 力,从而提高其组织的竞争优势开启数字化转型之旅。

中国 ITOM/ITOA 发展趋势

国内 ITOM 产业正迎来结构性变革,预计在未来五年内,中国 ITOM 市场基本维持当前 的增长态势,到 2023 年市场规模将达到 165.7 亿元,2020-2023 年的年复合增长率为 10.7%。 与整体 ITOM 市场相比,ITOA 市场规模的增长将会非常迅速。随着 ITOA 在各行各业渗透率 的提高,ITOA 市场将会保持 22.9%的年复合增长率,预计到 2023 年中国 ITOA 的市场规模 将达到 34.0 亿元。

ITOM 运维发展方向:从 ITIL 向 DevOps 发展

ITIL 为企业的 IT 服务管理提供了一个客观、严谨、可量化的最佳实践标准和规范。在 IOE 技术架构的年代,以 ITIL 理念为为核心的各种 ITSM 系统将运维操作流程化、规范化、分工化。 这种集中式的技术架构结构相对简单,运维操作稳妥,但是无法满足企业对于按需应变、敏 捷响应的业务需求。DevOps 以自动化工具下高效率的自动化操作代替冗长流程控制下的规 范性,更适合现代化企业的开发运维需求。需要注意的是,ITIL 体系并未完全过时,企业需 要将 ITIL 和 DevOps 与自身开发运维的特点相结合。考虑到传统企业的转型过程是从建设思 路、技术落地到敏捷运维的演进,ITOM 厂商既要充分利用好原有基础设施以保持稳定服务, 也应当通过 DevOps 体系满足客户不断迸发的新业务需求。

ITOM 运维发展方向:从 ITOM 到 AIOps 发展

当前互联网和移动互联网发展迅猛,为了更好应对激烈的市场竞争,越来越多的企业开 始利用云计算及大数据等新兴信息技术进行数字化转型,国内 IT 产业也面临包括系统架构复 杂化、运维数据多维化、用户需求多样化等变革。面对这些新形势下的挑战, ITOM 需要从 原有的人工加被动响应,转变为更加自动、高效的智能运维即 AIOps。AIOps 的定义涵盖的 两个阶段,第一阶段是数据到信息分析层次的提升;第二阶段是信息到知识提取层次的提升。 从数据到信息的分析,更多的是采用数据统计方法,帮助运维相关人员更好地从众多运维数 据中了解系统的运行状态,分析并定位故障,实时获取统计数据。从信息到知识的提升更多 的是希望借助人工智能算法,在信息分析的基础上通过机器学习的方式实现异常状况检测、 故障/趋势分析、故障关联和精准告警。 AIOps 构建在传统 ITOM 之上,把 ITOM 作为分析的源头,通过接口集成将各 ITOM 组 件中的孤立运维数据进行汇总,再借助自身的关联分析、机器学习、数据建模、全局搜索能 力,帮助企业趋势预判、快速故障定位和商业洞察等价值。在大数据和人工智能运维场景下 进行的性能分析、潜在故障挖掘和根因识别定位,都将超过人工运维的判断准确性,会是未 来 ITOM 的重要发展方向。

ITOA 市场发展方向:数据维度多样

ITOA 通过收集、处理和分析运维数据协助企业进行有效决策。数据接入能力是 ITOA 厂 商的关键竞争要素,数据采集全面、数据库先进安全、数据维度来源多样化决定了 ITOA 产品的性能和速度。当前的 ITOA 市场主要集中于日志分析和搜索,日志处理能力的增强使得 可利用的数据范围变得更加广泛,沉积在 IT 系统中的大量历史数据将可以发挥他们的价值。 虽然目前的日志分析多专注于日志数据,但通过将日志数据与面向最终用户、基础设施和应 用性能的数据相结合,ITOA 通过数据维度多样化将可以实现全面的根因分析和主动的容量 优化。

ITOA 市场发展方向:平台模式输出

在商业模式的探索上,云计算技术的发展和落地也为 ITOA 带来了改变。尽管内部部署 和软件许可证的模式仍将占据 ITOA 市场中的主要部分,但是以平台模式进行交付的 ITOA 将会越来越多。同时,ITOA 行业局限性将被逐渐打破,ITOA 厂商会围绕行业特性进行不同定制需求的探索,主要围绕容量分析、故障分析、故障预测、风险控制和业务分析等多个方 面向更多行业和各类型的企业渗透。相对于 SaaS 模式在中国市场单一工具输出,平台型解决方案的模式在满足客户定制化需求上更具有优势,以模块化的产品组合解决客户定制化的需求,从而保证交付效率。

中国 ITOM/ITOA 应用领域

作为基础的运维工具,ITOM 下游客户分布广泛。其中应用领域最广泛是金融和电信, 除自研能力极强的中大型互联网公司,包括交通运输、政府、教育、医疗等在内的各个领域都存在 ITOM 的需求。金融行业正处于向互联网业务融合的时期,相比于其他行业,金融行业在 IT 运维管理方面呈现出系统规模大、业务复杂程度高的特性,且面临严格的金融监管要求,金融机构对实时性、稳定性、业务连续性的要求更高。随着网络软化及云计算、5G 等技 术的不断成熟,电信行业面临分工细化和网络转型的挑战,将有望通过智能化运维提升 IT 运 维效率、优化运维成本等。

政府机构对电子政务的建设和应用高度关注,发布了一系列政策推动电子政务的发展, 正在通过加大政务信息化建设力度,保障安全、稳定、高效的电子政务运行。制造业中,中大型企业对运维管理的需求更高,小型企业因为软硬件成本高、体能增效不明显等原因通常 应用 ITOM/ITOA 的比例较低。互联网企业具有业务迭代迅速、需求不断变化的特点,正在 通过对自动化、智能化的探索来代替 ITIL 标准下的传统运维。

814256b5788a0b2bfb21ff065cf5e64d.jpg

金融行业是 ITOM/ITOA 市场重点领域,银行业占金融行业的市场份额最大,其次为保 险业、证券业等其他细分领域的需求相对较小。2019 年中国金融行业 ITOM、ITOA 市场规 模分别为 30.8 亿元、5.1 亿元,其中银行业的占比为 70.9%、73.4%。预计未来四年内金融 行业在 ITOM 方面的投入将保持 11.5%的年复合增长率,到 2023 年市场规模将达到 43.6 亿元。

由于行业特殊性及政府监管要求,金融行业对数据私密性和安全性需求较高,尤其大型 金融机构会在生产系统之上搭建测试系统,业务应用上线前在测试系统中试运行,因此在测 试系统的运维监控上投入很大。现阶段金融行业正处在向互联网业务转型的关键时期,金融机构越来越将业务数据视为一项重要的资产,从而更加关注与数据资产相关的运维管理。而 IT 系统规模扩大、业务复杂化以及功能性增加,让金融机构对 ITOM/ITOA 产品的需求趋于 多样化,预期市场增量将主要来自 IT 系统老旧替换和新的功能性带来的 IT 运维需求。

银行业在 ITOM/ITOA 的需求上呈现逐步部署的特征,其中四大行的 IT 系统规模庞大, 具有内部研发和完整的实施能力,走在行业的应用前沿。随着传统银行业生态的重构,银行 机构内部对于 IT 建设的参与度大幅提升,四大行互联网银行、生物识别等新兴业务层出不穷, 既要依托于原有的 IT 基础架构建设,也会增加新的负载需求,带来 ITOM/ITOA 的增量空间。 大行主导的科技应用不断向整个行业蔓延,越来越多的银行开始关注并部署自动化、智能化 运维体系,中小城商行、农商行等对于 ITOM/ITOA 的投入较为薄弱,但是预计在政策的推 动下行业渗透率会逐渐增加。

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
相关文章
|
20天前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
108 3
|
9天前
|
机器学习/深度学习 人工智能 运维
智能化运维####
本文深入探讨了智能化运维的前沿趋势与实践,通过融合大数据、人工智能等先进技术,重塑传统IT运维模式。我们分析了智能化运维的核心价值,包括提升效率、减少故障响应时间及增强系统稳定性,并通过具体案例展示了其在现代企业中的应用成效。对于追求高效、智能运维管理的组织而言,本文提供了宝贵的洞见和策略指导。 ####
|
11天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代IT基础设施中的应用与价值####
本文探讨了智能化运维(AIOps)在现代IT基础设施管理中的实际应用、面临的挑战及其带来的深远影响。通过引入先进的算法和机器学习模型,智能化运维不仅提高了故障检测与响应的速度,还显著优化了资源配置,降低了运营成本,为企业数字化转型提供了强有力的技术支撑。 ####
|
9天前
|
机器学习/深度学习 人工智能 运维
智能运维在现代IT系统中的应用与挑战####
本文深入探讨了智能运维(AIOps)在现代IT系统中的关键作用,通过具体案例分析,揭示了其在提升系统稳定性、优化资源配置及自动化故障处理方面的显著优势。同时,文章也指出了实施智能运维过程中面临的数据安全、技术整合及人员技能转型等挑战,并提出了相应的解决策略,为读者提供了全面而深刻的见解。 ####
34 6
|
11天前
|
机器学习/深度学习 运维 监控
智能化运维:从被动响应到主动预防的转型之路####
本文深入探讨了智能化运维(AIOps)如何引领信息技术管理从传统的被动响应模式向主动预防机制转变,强调了大数据、人工智能算法与机器学习技术在提升系统稳定性和效率中的关键作用。通过分析智能化运维的核心价值、实施策略及面临的挑战,本文为读者揭示了一个更加智能、高效且灵活的IT运维未来蓝图。 ####
|
9天前
|
人工智能 运维 监控
智能运维在现代数据中心的应用与挑战
随着云计算和大数据技术的迅猛发展,现代数据中心的运维管理面临着前所未有的挑战。本文探讨了智能运维技术在数据中心中的应用,包括自动化监控、故障预测与诊断、资源优化等方面,并分析了当前面临的主要挑战,如数据安全、系统集成复杂性等。通过实际案例分析,展示了智能运维如何帮助数据中心提高效率、降低成本,并提出了未来发展趋势和建议。
|
9天前
|
机器学习/深度学习 数据采集 人工智能
运维新纪元:AIOps引领智能运维变革####
本文探讨了人工智能与运维管理深度融合的前沿趋势——AIOps(Artificial Intelligence for Operations),它通过机器学习、大数据分析等技术手段,为现代IT运维体系带来前所未有的智能化升级。不同于传统依赖人力的运维模式,AIOps能够实现故障预测、自动化修复、性能优化等功能,大幅提升系统稳定性和运营效率。文章将深入分析AIOps的核心价值、关键技术组件、实施路径以及面临的挑战,旨在为读者揭示这一新兴领域如何重塑运维行业的未来。 ####
|
13天前
|
机器学习/深度学习 人工智能 运维
智能化运维:从被动响应到主动预防####
【10月更文挑战第29天】 本文探讨智能化运维(AIOps)如何通过融合大数据、机器学习与自动化技术,推动IT运维管理从传统的被动响应模式向主动预防机制转变。不同于传统摘要概述全文内容的方式,本文摘要旨在直接揭示智能化运维的核心价值——利用智能算法预测潜在故障,减少系统停机时间,提升运维效率与服务质量,同时强调其在现代企业IT架构中的关键作用。 ####
46 9
|
8天前
|
机器学习/深度学习 数据采集 人工智能
智能运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的兴起背景、核心组件及其在现代IT运维中的应用。通过对比传统运维模式,阐述了AIOps如何利用机器学习、大数据分析等技术,实现故障预测、根因分析、自动化修复等功能,从而提升系统稳定性和运维效率。文章还深入分析了实施AIOps面临的挑战与解决方案,并展望了其未来发展趋势。 ####
|
15天前
|
数据采集 机器学习/深度学习 运维
智能化运维在现代IT系统中的应用与挑战####
【10月更文挑战第29天】 本文探讨了智能化运维(AIOps)在现代IT系统中的重要作用及其面临的主要挑战。通过引入机器学习和大数据分析,智能化运维能显著提高系统稳定性、降低运营成本,并增强故障预测能力。然而,数据质量、技术整合及安全性等问题仍是其广泛应用的主要障碍。本文详细分析了这些挑战,并提出了相应的解决方案和未来发展趋势。 ####
38 5