《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地

本文涉及的产品
函数计算FC,每月15万CU 3个月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
应用实时监控服务-用户体验监控,每月100OCU免费额度
简介: 《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地

image.png 

客户简介

友邦人寿是香港联合交易所上市的人寿保险集团,覆盖18个市场。截至20211231号,总资产3400亿美元。友邦人寿于1992年在上海设立分公司,是改革开放后最 早一批获发个人人身保险业务营业执照的非本土保险机构之一,也是第一家将保险营销 员制度引进国内的保险公司。20206月,友邦获批将友邦保险有限公司上海分公司改 建为友邦人寿保险有限公司。20207月,友邦人寿正式成为中国内地首家外资独资人 寿保险公司。友邦友享App2021年荣获最佳保险科技平台。

客户痛点

观测复杂度提升:云原生微服务化带来高HA的同时,提升了系统复杂度,加大可观 测难度。业务需要提供全局视角观测整个保单生命周期里重要业务节点的运行情况, 并获取研发态具体情况。

统一观测困难:由于历史原因,内部应用技术选型不一、版本各异,导致可观测技术 和调用链追踪面临很大的困难。同时,开发系统与应用运维完全分开,日志也完全分 开存储和维护,因此在同一个大盘里呈现关联数据有较大难度。

难以快速故障定位:在IDC机房时代,没有直观方式让应用查看相关资源安全水位。 虽有商业APM工具,但其价格高昂。问题发生时,因只有少量应用安装APM,造成 调用链不完整,无法实现快速故障定位。

方案亮点

全链路追踪提升故障定位效率:合业务设计,借助ARMS应用监控及链路追踪构建 相应链路追踪、应用性能监控,将应用API接口翻译成业务可读懂的语言。在线上出 现问题时,可直接拉起全链路的调用链追踪,结合应用诊断工具Arthas. JVM调优工 具、应用日志及资源级别监控来进行问题定界与故障排查,极大程度地提高了排查问 题的效率。

Prometheus 统一观测借助Prometheus服务对运行态进行观测,并聚焦系统层、 应用层和业务层对应的不同核心指标,实现应用服务与资源的统一观测。

Grafana 统一展现:根据设计的观测指标,借助Grafana的丰富图表进行统一展示。 从而实现通过大屏、中屏和小屏,三屏联动方式形成指挥决策、研发仪表盘&应用性 能展示以及告警推送、多维度的监控能力。

建设成果

友邦为了满足业务发展需求,在技术层面进行可观测技术架构的升级和改造。

观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。

观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。

更高效的故障定位能力:针对服务资源追踪,将服务运行节点上的CPU内存、网络磁 盘I/O.应用指标进行聚合。问题发生时,能够轻松观察到异常指标。同时,调用链 关联服务上下游,实现从Trace关联到日志,获取到链路问题所在。全面提升了问题 诊断效率,还提升了用户体验。

相关产品

 应用实时监控服务ARMS

Prometheus 监控

链路追踪

相关实践学习
通过云拨测对指定服务器进行Ping/DNS监测
本实验将通过云拨测对指定服务器进行Ping/DNS监测,评估网站服务质量和用户体验。
目录
打赏
0
0
0
0
50
分享
相关文章
云消息队列 Kafka 版 V3 系列荣获信通院“云原生技术创新标杆案例”
2024 年 12 月 24 日,由中国信息通信研究院(以下简称“中国信通院”)主办的“2025 中国信通院深度观察报告会:算力互联网分论坛”,在北京隆重召开。本次论坛以“算力互联网 新质生产力”为主题,全面展示中国信通院在算力互联网产业领域的研究、实践与业界共识,与产业先行者共同探索算力互联网产业未来发展的方向。会议公布了“2024 年度云原生与应用现代化标杆案例”评选结果,“云消息队列 Kafka 版 V3 系列”荣获“云原生技术创新标杆案例”。
134 19
阿里云携手神州灵云打造云内网络性能监测标杆 斩获中国信通院高质量数字化转型十大案例——金保信“云内网络可观测”方案树立云原生运维新范式
2025年,金保信社保卡有限公司联合阿里云与神州灵云申报的《云内网络性能可观测解决方案》入选高质量数字化转型典型案例。该方案基于阿里云飞天企业版,融合云原生引流技术和流量“染色”专利,解决云内运维难题,实现主动预警和精准观测,将故障排查时间从数小时缩短至15分钟,助力企业降本增效,形成可跨行业复制的数字化转型方法论。
云原生应用实战:基于阿里云Serverless的API服务开发与部署
随着云计算的发展,Serverless架构日益流行。阿里云函数计算(Function Compute)作为Serverless服务,让开发者无需管理服务器即可运行代码,按需付费,简化开发运维流程。本文从零开始,介绍如何使用阿里云函数计算开发简单的API服务,并探讨其核心优势与最佳实践。通过Python示例,演示创建、部署及优化API的过程,涵盖环境准备、代码实现、性能优化和安全管理等内容,帮助读者快速上手Serverless开发。
实力见证!数据管理服务DMS、云原生多模数据库Lindorm荣获“2024技术卓越奖”
实力见证!数据管理服务DMS、云原生多模数据库Lindorm荣获“2024技术卓越奖”
Serverless Argo Workflows大规模计算工作流平台荣获信通院“云原生技术创新标杆案例”
2024年12月24日,阿里云Serverless Argo Workflows大规模计算工作流平台荣获由中国信息通信研究院颁发的「云原生技术创新案例」奖。
阿里云容器服务&云安全中心团队荣获信通院“云原生安全标杆案例”奖
2024年12月24日,阿里云容器服务团队与云安全中心团队获得中国信息通信研究院「云原生安全标杆案例」奖。
云原生之运维监控实践:使用 taosKeeper 与 TDinsight 实现对 时序数据库TDengine 服务的监测告警
在数字化转型的过程中,监控与告警功能的优化对保障系统的稳定运行至关重要。本篇文章是“2024,我想和 TDengine 谈谈”征文活动的三等奖作品之一,详细介绍了如何利用 TDengine、taosKeeper 和 TDinsight 实现对 TDengine 服务的状态监控与告警功能。作者通过容器化安装 TDengine 和 Grafana,演示了如何配置 Grafana 数据源、导入 TDinsight 仪表板、以及如何设置告警规则和通知策略。欢迎大家阅读。
159 0
云原生之旅:从传统架构到容器化服务的演变
随着技术的快速发展,云计算已经从简单的虚拟化服务演进到了更加灵活和高效的云原生时代。本文将带你了解云原生的概念、优势以及如何通过容器化技术实现应用的快速部署和扩展。我们将以一个简单的Python Web应用为例,展示如何利用Docker容器进行打包和部署,进而探索Kubernetes如何管理这些容器,确保服务的高可用性和弹性伸缩。
云原生之旅:Docker容器化实战
本文将带你走进云原生的世界,深入理解Docker技术如何改变应用部署与运维。我们将通过实际案例,展示如何利用Docker简化开发流程,提升应用的可移植性和伸缩性。文章不仅介绍基础概念,还提供操作指南和最佳实践,帮助你快速上手Docker,开启云原生的第一步。
一线实战:运维人少,我们从 0 到 1 实践 DevOps 和云原生
上海经证科技有限公司为有效推进软件项目管理和开发工作,选择了阿里云云效作为 DevOps 解决方案。通过云效,实现了从 0 开始,到现在近百个微服务、数百条流水线与应用交付的全面覆盖,有效支撑了敏捷开发流程。
19468 31

云原生

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等