客户简介
友邦人寿是香港联合交易所上市的人寿保险集团,覆盖18个市场。截至2021年12月 31号,总资产3400亿美元。友邦人寿于1992年在上海设立分公司,是改革开放后最 早一批获发个人人身保险业务营业执照的非本土保险机构之一,也是第一家将保险营销 员制度引进国内的保险公司。2020年6月,友邦获批将友邦保险有限公司上海分公司改 建为友邦人寿保险有限公司。2020年7月,友邦人寿正式成为中国内地首家外资独资人 寿保险公司。友邦友享App在2021年荣获最佳保险科技平台。
客户痛点
• 观测复杂度提升:云原生微服务化带来高HA的同时,提升了系统复杂度,加大可观 测难度。业务需要提供全局视角观测整个保单生命周期里重要业务节点的运行情况, 并获取研发态具体情况。
• 统一观测困难:由于历史原因,内部应用技术选型不一、版本各异,导致可观测技术 和调用链追踪面临很大的困难。同时,开发系统与应用运维完全分开,日志也完全分 开存储和维护,因此在同一个大盘里呈现关联数据有较大难度。
• 难以快速故障定位:在IDC机房时代,没有直观方式让应用查看相关资源安全水位。 虽有商业APM工具,但其价格高昂。问题发生时,因只有少量应用安装APM,造成 调用链不完整,无法实现快速故障定位。
方案亮点
• 全链路追踪提升故障定位效率:结合业务设计,借助ARMS应用监控及链路追踪构建 相应链路追踪、应用性能监控,将应用API接口翻译成业务可读懂的语言。在线上出 现问题时,可直接拉起全链路的调用链追踪,结合应用诊断工具Arthas. JVM调优工 具、应用日志及资源级别监控来进行问题定界与故障排查,极大程度地提高了排查问 题的效率。
• Prometheus 统一观测:借助Prometheus服务对运行态进行观测,并聚焦系统层、 应用层和业务层对应的不同核心指标,实现应用服务与资源的统一观测。
• Grafana 统一展现:根据设计的观测指标,借助Grafana的丰富图表进行统一展示。 从而实现通过大屏、中屏和小屏,三屏联动方式形成指挥决策、研发仪表盘&应用性 能展示以及告警推送、多维度的监控能力。
建设成果
友邦为了满足业务发展需求,在技术层面进行可观测技术架构的升级和改造。
• 观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。
• 观测体系全面升级:通过阿里云ARMS应用监控构建全链路追踪系统,结合 Prometheus监控进行统一的指标观测,并借助Grafana形成可观测统一视图,帮助 友邦搭建面向业务的完整可观测体系。
• 更高效的故障定位能力:针对服务资源追踪,将服务运行节点上的CPU内存、网络磁 盘I/O.应用指标进行聚合。问题发生时,能够轻松观察到异常指标。同时,调用链 关联服务上下游,实现从Trace关联到日志,获取到链路问题所在。全面提升了问题 诊断效率,还提升了用户体验。
相关产品
① 应用实时监控服务ARMS
② Prometheus 监控
③ 链路追踪