《2023云原生实战案例集》——01 汽车/制造——传音 基于ARMS构建全球一体化可观测平台,高效支撑业务创新

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
容器镜像服务 ACR,镜像仓库100个 不限时长
可观测监控 Prometheus 版,每月50GB免费额度
简介: 《2023云原生实战案例集》——01 汽车/制造——传音 基于ARMS构建全球一体化可观测平台,高效支撑业务创新

image.png 

客户简介

作为"非洲手机之王",传音从事以手机为核心的智能终端的设计、研发、生产、销售 和品牌运营,是新兴市场消费者喜爱的智能终端产品和移动互联服务提供商。据IDC报 告显示2021年占据非洲智能手机出货量的47.9%。传音移动互联广告平台是传音控股 的重要业务之一,是非洲最为主流的营销平台之一。

客户痛点

在技术架构方面,传音控股采用Spring Cloud进行全面微服务化,应用运行在阿里云容 器服务ACK之上,并分布在欧洲、亚洲等多个地区,真正实现了多地区服务体系。对于 该体系而言,要构建完整的可观测体系,挑战非常大。

观测对象众多:观测对象分布在不同的技术栈和架构中,要实现全面覆盖并有所侧重, 是非常大的挑战。

排查问线上问题慢:微服务化后,业务结构变得非常复杂,排查线上问题需要分析复 杂的调用链路,需要花费很长的时间。

推广难度大:新业务上线频率极快,有些业务为了快速上线减少工作量,不愿意接入 可观测平台,需要花额外的精力进行推广。

监控数据分散:在实现多地区部署后,每个地区都有一套独立的可观测平台,分散在 多个地区的可观测数据无法聚合展示,日常使用非常不方便。

方案亮点

提供统一指标体系:通过阿里云ARMSPrometheus,建立了覆盖资源层、容器层、 服务层、应用层、用户体验层的统一指标体系,实现从零散单点到规模化的全面覆盖。

全链路追踪诊断:接入ARMS应用监控后,可以非常方便地查看服务的健康状况和依 赖关系。在线上出现问题时,可以深入拉起全链路的调用链追踪,并定位到代码级别, 极大程度地提高了排查问题的效率。

无侵入式一键接入方案:只需要在应用部署时添加2行注解,就能自动注入Agent现全链路监控,对代码无侵入,不再需要运维团队花费精力在可观测平台的推广上。

全局聚合:通过阿里云Prometheus的全局聚合实例以及智能报警中心,对部署在全 球各地的业务系统进行统一大盘呈现和统一报警。

image.png

建设成果

运维技术全面升级:通过阿里云ARMS用监控构建全链路追踪系统,结合阿里云 Grafana提供的可观测统一视图,再对接至ARMS告警平台,最终对接至飞书群,传 音成功实现告警群内协作闭环,实现了 ChatOps的运维新范式。

提升业务创建效率传音在建立全新的可观测技术能力后,不仅提升了问题诊断效率, 还提升了用户体验。在此基础上,结合其他云原生新技术方案,业务上线效率提高了 60%,对于高效业务创新起到了至关重要的作用。

相关产品

应用实时监控服务ARMS

器服务ACK

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
相关文章
|
25天前
|
人工智能 缓存 异构计算
云原生AI加速生成式人工智能应用的部署构建
本文探讨了云原生技术背景下,尤其是Kubernetes和容器技术的发展,对模型推理服务带来的挑战与优化策略。文中详细介绍了Knative的弹性扩展机制,包括HPA和CronHPA,以及针对传统弹性扩展“滞后”问题提出的AHPA(高级弹性预测)。此外,文章重点介绍了Fluid项目,它通过分布式缓存优化了模型加载的I/O操作,显著缩短了推理服务的冷启动时间,特别是在处理大规模并发请求时表现出色。通过实际案例,展示了Fluid在vLLM和Qwen模型推理中的应用效果,证明了其在提高模型推理效率和响应速度方面的优势。
云原生AI加速生成式人工智能应用的部署构建
|
5天前
|
人工智能 Cloud Native 大数据
DataWorks深度技术解读:构建开放的云原生数据开发平台
Dateworks是一款阿里云推出的云原生数据处理产品,旨在解决数据治理和数仓管理中的挑战。它强调数据的准确性与一致性,确保商业决策的有效性。然而,严格的治理模式限制了开发者的灵活性,尤其是在面对多模态数据和AI应用时。为应对这些挑战,Dateworks进行了重大革新,包括云原生化、开放性增强及面向开发者的改进。通过Kubernetes作为资源底座,Dateworks实现了更灵活的任务调度和容器化支持,连接更多云产品,并提供开源Flowspec和Open API,提升用户体验。
|
19天前
|
Cloud Native
邀您参加云原生高可用技术沙龙丨云上高可用体系构建:从理论到实践
云原生高可用技术专场,邀您从理论到实践一起交流,探索云上高可用体系构建!
|
25天前
|
供应链 安全 Cloud Native
阿里云容器服务助力企业构建云原生软件供应链安全
本文基于2024云栖大会演讲,探讨了软件供应链攻击的快速增长趋势及对企业安全的挑战。文中介绍了如何利用阿里云容器服务ACK、ACR和ASM构建云原生软件供应链安全,涵盖容器镜像的可信生产、管理和分发,以及服务网格ASM实现应用无感的零信任安全,确保企业在软件开发和部署过程中的安全性。
|
30天前
|
Cloud Native JavaScript Docker
云原生技术:构建现代应用的基石
在数字化转型的浪潮中,云原生技术如同一艘承载梦想的航船,引领企业驶向创新与效率的新海域。本文将深入探索云原生技术的核心价值,揭示其如何重塑软件开发、部署和运维模式,同时通过一个简易代码示例,展现云原生应用的构建过程,让读者领略到云原生技术的魅力所在。
|
2月前
|
运维 Cloud Native 云计算
云原生之旅:Docker容器化实战
本文将带你走进云原生的世界,深入理解Docker技术如何改变应用部署与运维。我们将通过实际案例,展示如何利用Docker简化开发流程,提升应用的可移植性和伸缩性。文章不仅介绍基础概念,还提供操作指南和最佳实践,帮助你快速上手Docker,开启云原生的第一步。
|
2月前
|
运维 Cloud Native Docker
云端漫步:构建你的第一个云原生应用
在这篇文章中,我们将一起踏上一段激动人心的旅程,探索如何从零开始构建一个云原生应用。我们将深入理解云原生的核心概念,并通过实际代码示例,学习如何利用云平台的强大功能来部署和管理应用。无论你是初学者还是有经验的开发者,这篇文章都将为你提供宝贵的指导和启发。让我们一起开启这场云端之旅,发现云原生应用的魅力吧!
40 3
|
3月前
|
移动开发 监控 Android开发
Android & iOS 使用 ARMS 用户体验监控(RUM)的最佳实践
本文主要介绍了 ARMS 用户体验监控的基本功能特性,并介绍了在几种常见场景下的最佳实践。
410 13
|
5月前
|
运维 监控 数据可视化
ARMS的微服务监控
【8月更文挑战第23天】
82 6
|
8月前
|
监控 Java 索引
APM Server监控
APM Server监控

相关产品

  • 应用实时监控服务