云原生多模数据库 Lindorm助力东软集团 运维监控可视化

本文涉及的产品
云原生内存数据库 Tair,内存型 2GB
云原生多模数据库 Lindorm,多引擎 多规格 0-4节点
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介: 东软创立于1991年,是中国第一家上市的软件公司,一直以来致力于以信息技术的创新,推动社会发展,创造美好生活。东软集团以软件技术为核心,业务领域覆盖智慧城市、医疗健康、智能汽车互联及软件产品与服务。目前,东软在全球拥有近20000名员工,在中国建立了覆盖60多个城市的研发、销售及服务网络,在美国、日本、欧洲等地设有子公司。此外,东软连续四次入选普华永道“全球软件百强企业”,还曾荣获最具全球竞争力中国公司20强、中国50强全球挑战者、亚洲最受赏识的知识型企业、亚太地区最佳雇主等奖项。

image.png

客户感言

利用阿里云新一代云原生多模数据库Lindorm“灵动”引擎驱动的政府、企业数字信息系统智能运维解决方案,东软做到了实时、海量、异构监控数据一站式存储,实现指标、日志、代码链路和网络包等异构数据融合分析,高可靠数据保障和遍在可达实时监控数据存储云端服务。如图1所示,阿里Lindorm数据库在赋能政企数字运维团队更强大的运维大数据分析能力的同时,大幅度提升了政府、企业数字系统性能和在线服务的客户数字体验,降低了低价值密度监控数据存储管理成本。
image.png

客户简介

东软创立于1991年,是中国第一家上市的软件公司,一直以来致力于以信息技术的创新,推动社会发展,创造美好生活。东软集团以软件技术为核心,业务领域覆盖智慧城市、医疗健康、智能汽车互联及软件产品与服务。目前,东软在全球拥有近20000名员工,在中国建立了覆盖60多个城市的研发、销售及服务网络,在美国、日本、欧洲等地设有子公司。此外,东软连续四次入选普华永道“全球软件百强企业”,还曾荣获最具全球竞争力中国公司20强、中国50强全球挑战者、亚洲最受赏识的知识型企业、亚太地区最佳雇主等奖项。

业务要求与挑战

线上互联网化的信息服务繁荣发展为政府、企业数字系统运维应用维稳和客户数字体验保障提出了更高要求。在互联网服务场景下,运维监控数据量激增,采集监控的数据类型更加多样(时序指标、日志、代码链路等),现有运维系统采用的单模引擎(如RRD数据库、openTSDB时序数据库、ElasticSearch检索类数据库)应对这些实时、高并发采集,且价值密度较低的监控数据存储和检索场景时,已经显得力不从心。
跟据Forrest统计数据,目前有57%的企业客户IT运维部反馈至少每周会发生一次影响应用性能和可用性的问题;每天都发生问题的比例占到了28%。对于愈加依赖应用面向客户实现企业价值,提升工作效率的当今企业来说,这种问题越来越无法忍受。统计数据显示有超过一半的企业认为由于应用性能问题直接导致业务用户和IT部门生效率降低和时间浪费;有42%的企业认为应用性能问题直接影响了企业收入。总得来说,造成这种现象的主要问题原因,可总结为以下两个方面:
(1) 新需求推动IT系统监控数据量激增: 移动智能终端设备的普及使应用逐渐渗入到我们工作生活的方方面面,企业应用数量激增。企业面向客户、合作伙伴和内部员工建设IT系统及应用复杂度和数量会随着产品智能、互联化的深入持续增长,对映可用性保障运维监控采集数据采集种类,以及需要存储的数据量同步激增,现有监控系统基于RRD数据库或关系数据库搭建的单模引擎的存储、检索能力和需求脱节。
(2) 产品数字化导致应用结构愈加复杂,监控数据类型更加多样: 技术方面,诸如混合云、数据分析、物联网、车联网、体域网等新技术的持续演进也使得应用结构愈加复杂,保障应用性能更加困难。据统计,超过一半(52%)的企业IT运维部门在监控管理工具上的投入是被动、针对特定问题且分散的。但由于存储能力有限,单模存储引擎功能单一,数据存储分散、碎片化,难以应对未来以应用为核心的IT监控运维新需求和技术演进。随着时间的推移,现有IT运维数据存储分析问题会恶化。
激增的应用复杂度及监控数据采集量和在网运维系统有限的监控运维数据存储检索能力之间的矛盾在加剧。目前,东软在物联网、互联网等新场景下面临的IT系统运维主要问题与挑战有:多模型数据融合分析困难,面向海量数据采集终端同时写入数据的并发能力弱,数据量大且价值密度低导致存储成本高,基于开源软件自建数据存储集群稳定性低运维成本高等问题,东软急需新型运维大数据存储引擎支撑,来对运维系统存储引擎升级改造。

解决方案

东软集团围绕运营商、政务云和汽车等行业新一代数字信息系统IT运维场景海量监控数据存储分析痛点,将从遍布全国多地域的手机、平板等终端连接应用系统业务服务的数字足迹和客户数字体验数据、云端&数据中心网络抓包分析数据,应用运行代码链路和日志数据全量采集存储于阿里云Lindorm灵动云原生多模数据库(如图2所示)。
image.png
以阿里云的云端Lindorm云原生多模数据库为核心,东软围绕运营商、汽车等目标场景监控运维特点,进一步扩展了应用智能运维产品RealSight APM和云管理产品SaCa Aclome能力,实现了高通量、高并发监控数据的实时、低成本存储。利用内置多模数据引擎处理能力,阿里云Lindorm完美适配东软客户IT运维监控场景数据存储分析需求。东软基于Lindorm打造,面向政企互联网化数字信息系统运维监控场景的新一代IT智能运维系统部署架构如图3所示,其中Lindorm作为核心运维数据存储、检索引擎全量接收来自移动终端、网络嗅探器、业务监控探针、日志采集器等多种数据来源实时采集的异构监控数据,以高并发、高通量数据写入方式将数据入库。在运维过程中,用户通过实时监控仪表盘、统计分析报表或风险定位、检测工具对接Lindorm多模引擎海量数据检索、分析能力,来满足不同应用场景的运维大数据信息提取需要。
image.png

适用场景:

  • 实时状态大屏展现
  • 应用海量日志检索
  • 定点用户行为追踪
  • 故障数据全量回溯分析
  • AI辅助异常检测等场景

客户价值:

  • 一体化指标、日志、代码链路、网络包等结构化、半结构化、无结构数据存储、检索、分析能力,降低开发部署复杂度;
  • 云端低成本海量运维数据存储,TCO大幅降低;
  • 高性能、高通量监控数据入库,轻松搞定大日活量应用系统监控;
  • 实时日志、指标等多模异构数据监控和回溯分析,简化低价值密度数据的信息提取;
  • 99.99%数据可用性,降低数据丢失风险;
  • 云端接入遍在可达,简化网络配置管理;
  • 开箱即用免维护,进一步降低系统维护成本;
  • 提供实时高精度全量监控数据存储和分析能力,为监控目标系统保驾护航,间接提升客户数字体验。

建设效果:

目前系统已经在阿里云端支撑某行业领先车企存储、检索从全球客户终端采集的用户数字足迹和客户体验数据,节约数据存储和系统维护成本达4成,建设效果如图4所示。
image.png
image.png
image.png
image.png

相关实践学习
Lindorm AIGC:十分钟搞定智能问答 + 多模态检索
通过使用Lindorm AIGC体验版服务,十分钟搞定定制化智能问答和多模态检索。
相关文章
|
14天前
|
边缘计算 运维 Kubernetes
云原生时代的运维转型之路
【8月更文挑战第29天】 在数字化转型的浪潮中,企业IT部门正面临前所未有的挑战。本文将探讨如何通过拥抱云原生技术,实现运维工作的现代化,提升系统稳定性和效率,同时降低运营成本。我们将分享实际案例,揭示成功转型的关键因素,并展望未来运维的发展趋势。
|
13天前
|
运维 监控 Cloud Native
自动化运维的魔法书云原生之旅:从容器化到微服务架构的演变
【8月更文挑战第29天】本文将带你领略自动化运维的魅力,从脚本编写到工具应用,我们将一起探索如何通过技术提升效率和稳定性。你将学会如何让服务器自主完成更新、监控和故障修复,仿佛拥有了一本能够自动翻页的魔法书。
|
21天前
|
运维 Cloud Native Devops
一线实战:运维人少,我们从 0 到 1 实践 DevOps 和云原生
上海经证科技有限公司为有效推进软件项目管理和开发工作,选择了阿里云云效作为 DevOps 解决方案。通过云效,实现了从 0 开始,到现在近百个微服务、数百条流水线与应用交付的全面覆盖,有效支撑了敏捷开发流程。
19229 24
|
2天前
|
运维 监控 Cloud Native
云原生时代的运维策略:从反应式到自动化
在云计算的浪潮下,运维领域经历了翻天覆地的变化。本文将带你领略云原生时代下的运维新风貌,探索如何通过自动化和智能化手段,实现从传统的反应式运维向主动、智能的运维模式转变。我们将一起见证,这一变革如何助力企业提升效率,保障服务的连续性与安全性,以及运维人员如何适应这一角色的转变,成为云原生时代的引领者。
16 8
|
6天前
|
运维 Kubernetes Cloud Native
云原生时代的运维转型之路
在云原生技术日益成熟的今天,传统的运维模式正面临着前所未有的挑战与机遇。本文旨在探讨如何在云原生大潮中实现运维的平滑转型,通过分析当前运维面临的困境、介绍云原生的基本概念及其对运维的影响,以及提供转型实践的策略和案例,为运维人员指明方向,帮助他们拥抱变化,乘风破浪。
|
18天前
|
Cloud Native 数据库 开发者
云原生数据库2.0问题之帮助阿里云数据库加速技术更新如何解决
云原生数据库2.0问题之帮助阿里云数据库加速技术更新如何解决
|
21天前
|
Cloud Native 关系型数据库 分布式数据库
云原生关系型数据库PolarDB问题之PolarDB相比传统商用数据库的优势如何解决
云原生关系型数据库PolarDB问题之PolarDB相比传统商用数据库的优势如何解决
24 1
|
21天前
|
运维 监控 Cloud Native
云原生时代的运维变革:从反应式到主动式
随着云原生技术的兴起,传统的运维模式正经历着前所未有的挑战与机遇。本文将探讨在云原生环境下,如何通过主动式的运维策略来提升系统的稳定性和效率,同时降低运维成本,为现代企业提供一条清晰的转型路径。
|
11天前
|
运维 Kubernetes 监控
自动化运维:使用Python脚本实现系统监控云原生技术实践:Kubernetes在现代应用部署中的角色
【8月更文挑战第31天】在现代IT运维管理中,自动化已成为提高效率和准确性的关键。本文将通过一个Python脚本示例,展示如何实现对服务器的自动监控,包括CPU使用率、内存占用以及磁盘空间的实时监测。这不仅帮助运维人员快速定位问题,也减轻了日常监控工作的负担。文章以通俗易懂的语言,逐步引导读者理解并实践自动化监控的设置过程。 【8月更文挑战第31天】本文旨在探索云原生技术的核心—Kubernetes,如何革新现代应用的开发与部署。通过浅显易懂的语言和实例,我们将一窥Kubernetes的强大功能及其对DevOps文化的影响。你将学会如何利用Kubernetes进行容器编排,以及它如何帮助你的
|
13天前
|
运维 Cloud Native Devops
云原生时代下的运维新思维
本文将探索在云计算和容器化技术日益成熟的今天,运维(Operations)领域的变革之路。我们将从传统运维的痛点出发,逐步引入云原生的概念,并详细讨论DevOps、持续集成/持续部署(CI/CD)、微服务架构等现代运维实践如何重塑IT运维工作。最后,通过案例分析,展示这些理念和技术在实际业务中如何落地,以及它们对运维团队技能要求的影响。

相关产品

  • 云原生多模数据库 Lindorm