客户简介
作为“非洲手机之王”,传音从事以手机为核心的智能终端的设计、研发、生产、销售和品牌运营,是新兴市场消费者喜爱的智能终端产品和移动互联服务提供商。据 IDC 报告显示 2021 年占据非洲智能手机出货量的 47.9%。传音移动互联广告平台是传音控股的重要业务之一, 是非洲最为主流的营销平台之一。
客户痛点
在技术架构方面, 传音控股采用 Spring Cloud 进行全面微服务化, 应用运行在阿里云容器服务 ACK 之上,并分布在欧洲、亚洲等多个地区,真正实现了多地区服务体系。对于该体系而言,要构建完整的可观测体系,挑战非常大。
观测对象众多 : 观测对象分布在不同的技术栈和架构中,要实现全面覆盖并有所侧重,是非常大的挑战。
排查问线上问题慢 : 微服务化后,业务结构变得非常复杂,排查线上问题需要分析复杂的调用链路,需要花费很长的时间。
推广难度大 : 新业务上线频率极快, 有些业务为了快速上线减少工作量, 不愿意接入可观测平台,需要花额外的精力进行推广。
监控数据分散 : 在实现多地区部署后,每个地区都有一套独立的可观测平台,分散在多个地区的可观测数据无法聚合展示,日常使用非常不方便。
方案亮点
提供统一指标体系 : 通过阿里云 ARMS 和 Prometheus, 建立了覆盖资源层、 容器层、 服务层、应用层、用户体验层的统一指标体系,实现从零散单点到规模化的全面覆盖。
全链路追踪诊断 : 接入 ARMS 应用监控后, 可以非常方便地查看服务的健康状况和依赖关系。在线上出现问题时, 可以深入拉起全链路的调用链追踪, 并定位到代码级别, 极大程度地提高了排查问题的效率。
无侵入式一键接入方案 : 只需要在应用部署时添加 2 行注解, 就能自动注入 Agent 实现全链路监控,对代码无侵入,不再需要运维团队花费精力在可观测平台的推广上。
全局聚合 : 通过阿里云 Prometheus 的全局聚合实例以及智能报警中心, 对部署在全球各地的业务系统进行统一大盘呈现和统一报警。
建设成果
运维技术全面升级 : 通过阿里云 ARMS 应用监控构建全链路追踪系统,结合阿里云 Grafana 提供的可观测统一视图, 再对接至 ARMS 告警平台, 最终对接至飞书群, 传音成功实现告警群内协作闭环,实现了 ChatOps 的运维新范式。
提升业务创建效率 : 传音在建立全新的可观测技术能力后, 不仅提升了问题诊断效率, 还提升了用户体验。在此基础上, 结合其他云原生新技术方案, 业务上线效率提高了 60%, 对于高效业务创新起到了至关重要的作用。
相关产品
1 应用实时监控服务 ARMS
2 容器服务 ACK