《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地

本文涉及的产品
应用实时监控服务ARMS - 应用监控,每月50GB免费额度
函数计算FC,每月15万CU 3个月
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
简介: 《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地

image.png 

客户简介

友邦人寿是香港联合交易所上市的人寿保险集团,覆盖18个市场。截至20211231号,总资产3400亿美元。友邦人寿于1992年在上海设立分公司,是改革开放后最 早一批获发个人人身保险业务营业执照的非本土保险机构之一,也是第一家将保险营销 员制度引进国内的保险公司。20206月,友邦获批将友邦保险有限公司上海分公司改 建为友邦人寿保险有限公司。20207月,友邦人寿正式成为中国内地首家外资独资人 寿保险公司。友邦友享App2021年荣获最佳保险科技平台。

客户痛点

观测复杂度提升:云原生微服务化带来高HA的同时,提升了系统复杂度,加大可观 测难度。业务需要提供全局视角观测整个保单生命周期里重要业务节点的运行情况, 并获取研发态具体情况。

统一观测困难:由于历史原因,内部应用技术选型不一、版本各异,导致可观测技术 和调用链追踪面临很大的困难。同时,开发系统与应用运维完全分开,日志也完全分 开存储和维护,因此在同一个大盘里呈现关联数据有较大难度。

难以快速故障定位:在IDC机房时代,没有直观方式让应用查看相关资源安全水位。 虽有商业APM工具,但其价格高昂。问题发生时,因只有少量应用安装APM,造成 调用链不完整,无法实现快速故障定位。

方案亮点

全链路追踪提升故障定位效率:合业务设计,借助ARMS应用监控及链路追踪构建 相应链路追踪、应用性能监控,将应用API接口翻译成业务可读懂的语言。在线上出 现问题时,可直接拉起全链路的调用链追踪,结合应用诊断工具Arthas. JVM调优工 具、应用日志及资源级别监控来进行问题定界与故障排查,极大程度地提高了排查问 题的效率。

Prometheus 统一观测借助Prometheus服务对运行态进行观测,并聚焦系统层、 应用层和业务层对应的不同核心指标,实现应用服务与资源的统一观测。

Grafana 统一展现:根据设计的观测指标,借助Grafana的丰富图表进行统一展示。 从而实现通过大屏、中屏和小屏,三屏联动方式形成指挥决策、研发仪表盘&应用性 能展示以及告警推送、多维度的监控能力。

建设成果

友邦为了满足业务发展需求,在技术层面进行可观测技术架构的升级和改造。

观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。

观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。

更高效的故障定位能力:针对服务资源追踪,将服务运行节点上的CPU内存、网络磁 盘I/O.应用指标进行聚合。问题发生时,能够轻松观察到异常指标。同时,调用链 关联服务上下游,实现从Trace关联到日志,获取到链路问题所在。全面提升了问题 诊断效率,还提升了用户体验。

相关产品

 应用实时监控服务ARMS

Prometheus 监控

链路追踪

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
相关文章
|
3月前
|
运维 Cloud Native Devops
一线实战:运维人少,我们从 0 到 1 实践 DevOps 和云原生
上海经证科技有限公司为有效推进软件项目管理和开发工作,选择了阿里云云效作为 DevOps 解决方案。通过云效,实现了从 0 开始,到现在近百个微服务、数百条流水线与应用交付的全面覆盖,有效支撑了敏捷开发流程。
19336 30
|
2月前
|
运维 Cloud Native Docker
云原生技术入门:Docker容器化实战
【9月更文挑战第20天】本文将引导你走进云原生技术的世界,通过Docker容器化技术的实战演练,深入理解其背后的原理和应用。我们将一起探索如何在云平台上利用Docker简化部署、扩展和管理应用程序的过程,并揭示这一技术如何改变现代软件的开发和运维模式。
|
3月前
|
Kubernetes Cloud Native Docker
云原生入门:Docker容器化部署实战
【8月更文挑战第31天】在数字化浪潮中,云原生技术成为企业转型的助推器。本文通过Docker容器化部署的实践案例,引导读者从零基础到掌握基础的云原生应用部署技能。我们将一起探索Docker的魅力,学习如何将一个应用容器化,并在云平台上运行起来,为深入云原生世界打下坚实基础。
|
4月前
|
存储 监控 Cloud Native
kubevela可观测体系问题之KubeVela云原生时代可观测性挑战的问题如何解决
kubevela可观测体系问题之KubeVela云原生时代可观测性挑战的问题如何解决
|
5月前
|
弹性计算 监控 Cloud Native
构建多模态模型,生成主机观测指标,欢迎来战丨2024天池云原生编程挑战赛
本次比赛旨在如何通过分析 ECS 性能数据和任务信息,综合利用深度学习、序列分析等先进技术,生成特定机器的性能指标。参赛者的解决方案将为云资源管理和优化决策提供重要参考,助力云计算资源的高效稳定运行和智能化调度。
648 17
|
4月前
|
存储 Cloud Native 智能网卡
共识协议的技术变迁问题之应用程序开发者应如何利用现有服务降低系统复杂性
共识协议的技术变迁问题之应用程序开发者应如何利用现有服务降低系统复杂性
|
3月前
|
运维 Kubernetes Cloud Native
Kubernetes云原生问题之在托管Kubernetes服务中云服务商和用户的运维责任划分如何解决
Kubernetes云原生问题之在托管Kubernetes服务中云服务商和用户的运维责任划分如何解决
39 0
|
4月前
|
运维 监控 负载均衡
云原生架构的演进:从微服务到服务的网格
【7月更文挑战第8天】云原生技术正以惊人的速度不断进化,其核心理念是构建可扩展、灵活且高度可靠的应用程序。本文将深入探讨云原生架构的关键组成部分,特别是微服务和服务网格,以及它们如何共同推动现代软件的发展。我们将通过一个具体的案例分析,揭示这些技术如何在现实世界中被应用来提升业务敏捷性和操作效率。
|
4月前
|
Kubernetes Cloud Native 微服务
企业级容器部署实战:基于ACK与ALB灵活构建云原生应用架构
这篇内容概述了云原生架构的优势,特别是通过阿里云容器服务Kubernetes版(ACK)和应用负载均衡器(ALB)实现的解决方案。它强调了ACK相对于自建Kubernetes的便利性,包括优化的云服务集成、自动化管理和更强的生态系统支持。文章提供了部署云原生应用的步骤,包括一键部署和手动部署的流程,并指出手动部署更适合有技术背景的用户。作者建议在预算允许的情况下使用ACK,因为它能提供高效、便捷的管理体验。同时,文章也提出了对文档改进的建议,如添加更多技术细节和解释,以帮助用户更好地理解和实施解决方案。最后,展望了ACK未来在智能化、安全性与边缘计算等方面的潜在发展。水文一篇,太忙了,见谅!
|
5月前
|
人工智能 监控 Cloud Native
多款可观测产品全面升级丨阿里云云原生 5 月产品月报
多款可观测产品全面升级丨阿里云云原生 5 月产品月报。