作为数字经济时代必不可少的一环,智能运维在企业数字化转型过程中扮演着重要角色。同时,随着数字经济的不断深入,以云原生、DevOps 等为代表的新技术的快速发展,让过去 20 年里以应用为中心构建的 IT 体系,面对前所未有的变革挑战。
可以看到的两个趋势是:当前工具式的监控体系已经无法满足企业的需求;从行业角度来看,运维监控正在从以点带面的 1.0 时代向数智融合的 3.0 时代发展。在行业、市场、用户等多重因素推动下,建设一体化的智能可观测平台已经成为必要。
近日,博睿数据正式推出一体化智能可观测平台 ONE,该平台旨在建立一体化、智能化、面向业务与用户体验的统一运维平台,助力企业提高数字化体验,降低运维成本,提升工作效率,为数字化转型赋能升级。
具体而言,一体化智能可观测平台 ONE 可以解决什么问题?有哪些技术特性?数字经济时代 IT 体系面临怎样的变革与挑战?运维监控的下一步将走向何方?博睿数据 CTO 孟曦东、博睿数据产品部高级总监孙丽、博睿数据 COO 吴静涛等专家日前在媒体沟通会上对此做进一步解读,并在接受 InfoQ 在内的几家媒体采访时,给出了他们的答案。
数字经济时代,IT 架构和运维体系面临的变革与挑战
数据显示,到 2025 年,数字经济迈向全面扩展期,数字经济核心产业增加值占 GDP 比重达到 10%。数字经济的发展带动了数字产业化和产业数字化的发展。
吴静涛表示,当前企业业务已然发生了转变。以金融为例,过去银行机构以 To C 业务为主导,随着互联网金融全面转型,业务也开始朝着 To B 等方向转变。对金融业而言,如何对实时数据做关联与缝合成了摆在面前的巨大挑战。而在基础软件产业,挑战则主要集中在如何打通“云管边端”去做管理,去做新的 IT 运维。
此外,随着云计算技术快速发展,无论是云原生还是混合云,都为企业的 IT 架构带来显著影响。从微服务架构来看,如何做好统一治理也是企业面临的主要难题。
在此背景下,近几年,运维行业正发生以下三个方面的变化:
第一,企业的视角发生变化。过去企业更多关注系统运维层面的机房建设、底层服务器搭建及购买,现在基于云化的基础设施,企业更注重业务搭建、业务体验优化以及业务运营。
第二,用户运维职责发生变化,更多地转向 DevOps 与 SRE。
第三,监控技术发生变化。微服务和分布式架构的兴起使得系统运维难度提升,发生故障时,微服务化以及分布式的依赖关系会导致调用异常错综复杂。同时,在容器化环境下运行时,环境动态性很强,当运维人员排障时会发现环境已经动态销毁或者发生了变更。
此外,从行业角度来看,根据知名咨询机构分析,目前监控平台存在以下五方面挑战:监控平台不统一,技术债与重复建设导致了孤岛式的监控体验;云计算、容器、微服务、物联网等新技术带来了对监控的挑战,监控的可见性不足;监控系统的建设与业务目标脱节;智能运维尚不成熟;有限的自动化与 DevOps 的敏捷开发理念产生冲突。
这种情况下,传统的运维监控技术已经很难帮助用户构建起一套高效的排障体系,这也使得可观测解决方案成为云原生架构下非常重要的课题。
孟曦东表示,“可观测市场不断增长,带来的不仅是机遇,同样也带来了更多挑战。企业对于可观测的视野不再局限于应用程序,而是需要从全局的角度洞察混合 IT 基础设施、数据源、网络、云和边缘端的应用状况,更加主动化、自动化和智能化地提升企业运维的效率。企业不仅仅需要应用的高可用,更需要数字化转型发展所带来的用户体验升级。”
运维监控将走向数智融合 3.0 时代
孙丽指出,目前国内运维监控处于 1.0 和 2.0 时代,而在未来,运维监控将走向数智融合的 3.0 时代。
具体而言,1.0 时代的运维企业是目前市场上占比比较多的,大概占 80%,这类企业提供的产品比较单一,没有组成有机的运维监控体系,存在的缺陷是监控工具比较孤立,可观测性是片面的。
2.0 时代的运维企业特点是“产品拼凑”,已经有了相对完善的产品监控体系,但没有做产品的有机整合,存在的缺陷是缺乏运维全局视角,有机关联性差。给用户带来的痛点包括数据融合困难、定位问题时需要在不同的产品之间切换、产品分析模型固化等等。
而在数智融合 3.0 时代,需要运维企业具备全局数据采集能力、以运维视角重塑产品、数据有机关联融合、开箱即用的 AI 以及运维全场景的落地等一系列运维能力。
“这是我们对整个行业的判断和认知,一体化智能可观测平台 ONE 正是数智融合 3.0 时代的典型代表产品。”孙丽表示,博睿数据正通过三大战略升级,提升运维体验:
从监控走向可观测。不仅仅是提供告警和数据,而是需要了解整个系统是如何运行的,以及它发生了什么问题。
从孤立的工具走向统一的能力平台。过去工具化的运维体系已经不再适合现在的数字化经济时代。
从人工分析走向智能见解。通过提供智能见解,告诉用户系统发生了什么,以及如何解决这些问题。
一体化智能可观测平台 ONE 的产品架构与特性
5 月 20 日,博睿数据正式推出了一体化智能可观测平台 ONE。在吴静涛看来,一体化智能可观测 ONE 平台的发布标志着博睿数据的整体战略正式进入了数据链 DNA+ 的时代。
产品架构
在产品架构层面,ONE 平台从 ITOM 统一监控、AIOps 智能运维、BizOps 业务运营、DevOps 效能提升四个应用场景出发,帮助企业走出数据中心,打通云管边端,通过代码到企业的全数据链 DNA 采集能力,结合 ONE 平台的大数据及 AI 能力,实现传统的产品工具到平台+架构的转型,构建以用户为中心的新运维体系。
具体而言,采集侧囊括了用户端到云端的所有数据,在用户端支持了目前包括 APP、Web、PC、小程序等多种终端的数据采集,在云端通过 SmartAgnet 完成采集 API、ITIM 以及网络的所有数据。同时,为了构建真正的一体化可观测平台,ONE 还支持外部数据集成与扩展。
下一步,采集到的数据会交由统一可观测能力智能中台,进行统一的转换、清洗以及载入等标准化处理,从而构建数据之间的关联性,提升数据质量。处理后的数据进入到多模态大数据引擎中,其提供 OLAP 分析、检索、图谱关联以及对象存储等大数据能力,并具有实时、多模态、一体化的特点。
三大特性
特性方面,ONE 具备统一、关联性、智能见解三大特性。
1.统一(All in ONE)
统一是实现真正可观测平台的第一步。一方面,统一极大地降低了用户的运维成本,另一方面,DevOps 可以基于同一个平台,就同一个事实,用相同的语言进行协作,效率也会大幅提升。
ONE 包含了两个统一,即统一运维监控技术栈和统一运维数据治理体系。满足了所有监控需求,即开即用,随时扩展,提升了系统可观测性广度与深度,同时面向业务与用户体验运维,囊括了系统的所有观测数据,进行统一管理,并提供丰富的集成扩展,解决因竖井式的监控带来的数据割裂、重复建设、可观测性差的问题。
2.关联性
随着企业数字化转型不断深入,数字化系统所囊括的对象越来越多,对象之间的依赖关系也愈加错综复杂,比如有纵向的支撑关系、横向的分布式调用关系等等。构建这些关系,是实现真正可观测平台的核心。
ONE 能完整复刻出数字化系统的数字孪生,内置 CMDB 引擎在保证全面可观测的同时也能掌握监控实体间的关系及其属性信息,实现关联追踪,解决排障难,检索追查难,现场还原不全面的问题。大大提升了排障效率,实现了系统之间的真正融合。
3.智能见解
见解是对系统的认知和理解能力,ONE 平台具备信息、经验、智能决策融合的智能见解能力,能够基于 AI 和规则自动发现问题,实现根因分析——智能见解——故障预测——故障修复等一系列智能分析过程,预置经验规则和 AI 共同提出见解,发现问题并给出根因,解决虚假问题扰乱运维、告警风暴、根因定位效率低的问题,帮助运维人员快速排障,提出解决办法,进而提高运维效率。
孙丽表示,未来,ONE 将朝着三个方向发展:
生态集成,通过打造整体的应用市场以及生态战略,兼容市场上主流监控数据的接入和集成。
细化用户体验与业务场景,包括在金融等某些特定场景下业务运维的能力。
持续建设关联性和智能化能力,未来会引入实体和关系快照,并引入智能知识问答,深化“系统帮助人思考”的能力。