《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
应用实时监控服务-应用监控,每月50GB免费额度
可观测监控 Prometheus 版,每月50GB免费额度
简介: 《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地

image.png 

客户简介

友邦人寿是香港联合交易所上市的人寿保险集团,覆盖18个市场。截至20211231号,总资产3400亿美元。友邦人寿于1992年在上海设立分公司,是改革开放后最 早一批获发个人人身保险业务营业执照的非本土保险机构之一,也是第一家将保险营销 员制度引进国内的保险公司。20206月,友邦获批将友邦保险有限公司上海分公司改 建为友邦人寿保险有限公司。20207月,友邦人寿正式成为中国内地首家外资独资人 寿保险公司。友邦友享App2021年荣获最佳保险科技平台。

客户痛点

观测复杂度提升:云原生微服务化带来高HA的同时,提升了系统复杂度,加大可观 测难度。业务需要提供全局视角观测整个保单生命周期里重要业务节点的运行情况, 并获取研发态具体情况。

统一观测困难:由于历史原因,内部应用技术选型不一、版本各异,导致可观测技术 和调用链追踪面临很大的困难。同时,开发系统与应用运维完全分开,日志也完全分 开存储和维护,因此在同一个大盘里呈现关联数据有较大难度。

难以快速故障定位:在IDC机房时代,没有直观方式让应用查看相关资源安全水位。 虽有商业APM工具,但其价格高昂。问题发生时,因只有少量应用安装APM,造成 调用链不完整,无法实现快速故障定位。

方案亮点

全链路追踪提升故障定位效率:合业务设计,借助ARMS应用监控及链路追踪构建 相应链路追踪、应用性能监控,将应用API接口翻译成业务可读懂的语言。在线上出 现问题时,可直接拉起全链路的调用链追踪,结合应用诊断工具Arthas. JVM调优工 具、应用日志及资源级别监控来进行问题定界与故障排查,极大程度地提高了排查问 题的效率。

Prometheus 统一观测借助Prometheus服务对运行态进行观测,并聚焦系统层、 应用层和业务层对应的不同核心指标,实现应用服务与资源的统一观测。

Grafana 统一展现:根据设计的观测指标,借助Grafana的丰富图表进行统一展示。 从而实现通过大屏、中屏和小屏,三屏联动方式形成指挥决策、研发仪表盘&应用性 能展示以及告警推送、多维度的监控能力。

建设成果

友邦为了满足业务发展需求,在技术层面进行可观测技术架构的升级和改造。

观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。

观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。

更高效的故障定位能力:针对服务资源追踪,将服务运行节点上的CPU内存、网络磁 盘I/O.应用指标进行聚合。问题发生时,能够轻松观察到异常指标。同时,调用链 关联服务上下游,实现从Trace关联到日志,获取到链路问题所在。全面提升了问题 诊断效率,还提升了用户体验。

相关产品

 应用实时监控服务ARMS

Prometheus 监控

链路追踪

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
相关文章
|
28天前
|
Kubernetes Cloud Native Docker
云原生之旅:从传统架构到容器化服务的演变
随着技术的快速发展,云计算已经从简单的虚拟化服务演进到了更加灵活和高效的云原生时代。本文将带你了解云原生的概念、优势以及如何通过容器化技术实现应用的快速部署和扩展。我们将以一个简单的Python Web应用为例,展示如何利用Docker容器进行打包和部署,进而探索Kubernetes如何管理这些容器,确保服务的高可用性和弹性伸缩。
|
29天前
|
运维 Cloud Native 云计算
云原生之旅:Docker容器化实战
本文将带你走进云原生的世界,深入理解Docker技术如何改变应用部署与运维。我们将通过实际案例,展示如何利用Docker简化开发流程,提升应用的可移植性和伸缩性。文章不仅介绍基础概念,还提供操作指南和最佳实践,帮助你快速上手Docker,开启云原生的第一步。
|
4月前
|
运维 Cloud Native Devops
一线实战:运维人少,我们从 0 到 1 实践 DevOps 和云原生
上海经证科技有限公司为有效推进软件项目管理和开发工作,选择了阿里云云效作为 DevOps 解决方案。通过云效,实现了从 0 开始,到现在近百个微服务、数百条流水线与应用交付的全面覆盖,有效支撑了敏捷开发流程。
19374 30
|
3月前
|
运维 Cloud Native Docker
云原生技术入门:Docker容器化实战
【9月更文挑战第20天】本文将引导你走进云原生技术的世界,通过Docker容器化技术的实战演练,深入理解其背后的原理和应用。我们将一起探索如何在云平台上利用Docker简化部署、扩展和管理应用程序的过程,并揭示这一技术如何改变现代软件的开发和运维模式。
|
6月前
|
弹性计算 监控 Cloud Native
构建多模态模型,生成主机观测指标,欢迎来战丨2024天池云原生编程挑战赛
本次比赛旨在如何通过分析 ECS 性能数据和任务信息,综合利用深度学习、序列分析等先进技术,生成特定机器的性能指标。参赛者的解决方案将为云资源管理和优化决策提供重要参考,助力云计算资源的高效稳定运行和智能化调度。
663 20
|
4月前
|
Kubernetes Cloud Native Docker
云原生入门:Docker容器化部署实战
【8月更文挑战第31天】在数字化浪潮中,云原生技术成为企业转型的助推器。本文通过Docker容器化部署的实践案例,引导读者从零基础到掌握基础的云原生应用部署技能。我们将一起探索Docker的魅力,学习如何将一个应用容器化,并在云平台上运行起来,为深入云原生世界打下坚实基础。
|
5月前
|
存储 监控 Cloud Native
kubevela可观测体系问题之KubeVela云原生时代可观测性挑战的问题如何解决
kubevela可观测体系问题之KubeVela云原生时代可观测性挑战的问题如何解决
|
5月前
|
存储 Cloud Native 智能网卡
共识协议的技术变迁问题之应用程序开发者应如何利用现有服务降低系统复杂性
共识协议的技术变迁问题之应用程序开发者应如何利用现有服务降低系统复杂性
|
4月前
|
运维 Kubernetes Cloud Native
Kubernetes云原生问题之在托管Kubernetes服务中云服务商和用户的运维责任划分如何解决
Kubernetes云原生问题之在托管Kubernetes服务中云服务商和用户的运维责任划分如何解决
41 0
|
5月前
|
运维 监控 负载均衡
云原生架构的演进:从微服务到服务的网格
【7月更文挑战第8天】云原生技术正以惊人的速度不断进化,其核心理念是构建可扩展、灵活且高度可靠的应用程序。本文将深入探讨云原生架构的关键组成部分,特别是微服务和服务网格,以及它们如何共同推动现代软件的发展。我们将通过一个具体的案例分析,揭示这些技术如何在现实世界中被应用来提升业务敏捷性和操作效率。
下一篇
DataWorks