《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 《2023云原生实战案例集》——05 金融服务——友邦人寿 可观测体系设计与落地

image.png 

客户简介

友邦人寿是香港联合交易所上市的人寿保险集团,覆盖18个市场。截至20211231号,总资产3400亿美元。友邦人寿于1992年在上海设立分公司,是改革开放后最 早一批获发个人人身保险业务营业执照的非本土保险机构之一,也是第一家将保险营销 员制度引进国内的保险公司。20206月,友邦获批将友邦保险有限公司上海分公司改 建为友邦人寿保险有限公司。20207月,友邦人寿正式成为中国内地首家外资独资人 寿保险公司。友邦友享App2021年荣获最佳保险科技平台。

客户痛点

观测复杂度提升:云原生微服务化带来高HA的同时,提升了系统复杂度,加大可观 测难度。业务需要提供全局视角观测整个保单生命周期里重要业务节点的运行情况, 并获取研发态具体情况。

统一观测困难:由于历史原因,内部应用技术选型不一、版本各异,导致可观测技术 和调用链追踪面临很大的困难。同时,开发系统与应用运维完全分开,日志也完全分 开存储和维护,因此在同一个大盘里呈现关联数据有较大难度。

难以快速故障定位:在IDC机房时代,没有直观方式让应用查看相关资源安全水位。 虽有商业APM工具,但其价格高昂。问题发生时,因只有少量应用安装APM,造成 调用链不完整,无法实现快速故障定位。

方案亮点

全链路追踪提升故障定位效率:合业务设计,借助ARMS应用监控及链路追踪构建 相应链路追踪、应用性能监控,将应用API接口翻译成业务可读懂的语言。在线上出 现问题时,可直接拉起全链路的调用链追踪,结合应用诊断工具Arthas. JVM调优工 具、应用日志及资源级别监控来进行问题定界与故障排查,极大程度地提高了排查问 题的效率。

Prometheus 统一观测借助Prometheus服务对运行态进行观测,并聚焦系统层、 应用层和业务层对应的不同核心指标,实现应用服务与资源的统一观测。

Grafana 统一展现:根据设计的观测指标,借助Grafana的丰富图表进行统一展示。 从而实现通过大屏、中屏和小屏,三屏联动方式形成指挥决策、研发仪表盘&应用性 能展示以及告警推送、多维度的监控能力。

建设成果

友邦为了满足业务发展需求,在技术层面进行可观测技术架构的升级和改造。

观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。

观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。

更高效的故障定位能力:针对服务资源追踪,将服务运行节点上的CPU内存、网络磁 盘I/O.应用指标进行聚合。问题发生时,能够轻松观察到异常指标。同时,调用链 关联服务上下游,实现从Trace关联到日志,获取到链路问题所在。全面提升了问题 诊断效率,还提升了用户体验。

相关产品

 应用实时监控服务ARMS

Prometheus 监控

链路追踪

相关文章
|
3月前
|
监控 Cloud Native 安全
浅谈云原生可观测性
【1月更文挑战第23天】
|
4月前
|
监控 Cloud Native
如何选择合适的云原生可观测工具
如何选择合适的云原生可观测工具
|
4月前
|
Kubernetes Cloud Native 应用服务中间件
云原生|kubernetes 你真的学废了吗---实战k8s 一(jsonpath实战)
云原生|kubernetes 你真的学废了吗---实战k8s 一(jsonpath实战)
67 0
|
3月前
|
Cloud Native Java 开发工具
云原生 阿里云分布式文件系统 对象存储OSS 服务配置
【1月更文挑战第8天】云原生 阿里云分布式文件系统 对象存储OSS 服务配置
|
28天前
|
Java fastjson 数据安全/隐私保护
【Dubbo3技术专题】「云原生微服务开发实战」 一同探索和分析研究RPC服务的底层原理和实现
【Dubbo3技术专题】「云原生微服务开发实战」 一同探索和分析研究RPC服务的底层原理和实现
39 0
|
2月前
|
人工智能 运维 监控
「云原生可观测团队」获选「InfoQ 年度技术内容贡献奖」
「云原生可观测团队」获选「InfoQ 年度技术内容贡献奖」
|
3月前
|
人工智能 运维 Cloud Native
|
3月前
|
存储 Prometheus 监控
成本更低、更可控,云原生可观测新计费模式正式上线
成本更低、更可控,云原生可观测新计费模式正式上线
|
3月前
|
存储 缓存 Kubernetes
云原生场景下,AIGC 模型服务的工程挑战和应对
本文介绍了在云原生场景下,AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。
135610 24
|
4月前
|
监控 Cloud Native 关系型数据库
记录一次云原生线上服务数据迁移全过程
记录一次云原生线上服务数据迁移全过程
记录一次云原生线上服务数据迁移全过程