如何用阿里云实行全链路数据追踪

本文涉及的产品
对象存储 OSS,20GB 3个月
文件存储 NAS,50GB 3个月
云备份 Cloud Backup,100GB 3个月
简介: 阿里云采用了日志服务,帮助畅捷通构建了用户体验感知、业务安全合规、用户业务链路追踪、成本预算的使用场景,实现了对用户、业务、成本、安全等方面的全维度感知,使得运维效率提升了30%。

在日常生活中,遇到电脑卡、迟缓等问题,我们都会下意识地觉得“电脑坏了”,我们会介意每一秒的延迟带来的等待,等待的这一秒可能会让你输了这场比赛、损失一笔交易、错过一段爱情……。因此为了改善这一秒的延迟,我们会认真仔细地检查系统、硬件、网络等。也会为了这一秒的延迟,花重金来升级设备。在日常生活中,我们对于“慢”可谓是深恶痛疾,而企业又何尝不是呢?

随着互联网的以及基础设施的发展,越来越多的企业将业务搬到线上,业务数字化已经在各个行业得到广泛应用,推动各行业的业务创新,提升了用户体验和效率。在业务往数据化转型的浪潮下,企业业务就面临以下四个趋势:

  1. 体验是关键的竞争力之一:统计结果,发现1秒的延迟增加,平均会带来7%的用户流失。
  2. 创新迭代在加速::55%的应用,每周甚至是每天,都会发布更新。
  3. 基础实施与架构在革新:多数企业业务采用了新型架构,这些变化,让业务更敏捷迭代,并可支撑更加复杂的业务、提升运营效率。
  4. 运维数据的多样化:包括运维数据容量、可变性、种类都在增加,比如日志/指标/链路/审计/CMDB等。

图片 1.png

从以上四个趋势得出,如何提升用户体验,让业务快速且稳定地为用户服务,是企业在这个时代发展的关键。而“慢”,对于企业来说,就是一种故障。慢一秒可能会损失大量的用户、慢一秒可能会让服务器崩溃、慢一秒可能会被市场淘汰汰。

但更好的用户体验也意味着更高的投入,让IT设施成为企业发展中累赘是一件很不明智的事情。那企业该如何克服这类问题呢?

针对这类问题,“微服务”应运而生。传统的IT架构大多都是各种独立系统的堆砌,这些系统的问题总结来说就是扩展性差,可靠性不高,维护成本高。但使用微服务架构后,越来越多的系统被拆解成了多个微服务。企业可将大量通用功能下沉为服务,并对服务不断进行拆分,再根据不同的业务形态,快速组装出前端应用,通过服务组装和聚合的方式实现更快的开发速度,前端也能变得更轻。

但大量的微服务,使得整体运维难度也会提升,不同的微服务可能会带来不同类型的数据、大量的警告以及处理不完的故障。那么能否有简单的方式,来对大量的微服务进行管理呢?

畅捷通信息技术股份有限公司是用友旗下成员企业,致力于为小微企业提供社交化、个性化、服务化、小量化的生意管理支持。畅捷通充分利用SaaS业务与客户的高频互动的优势深挖客户的价值,从而多方面满足小微企业对云产品的需求。畅捷通提出以畅捷通T+为核心的“云+端”战略,以数智财税、数智商业为核心,以数据服务与生态服务为延展,通过Spring Cloud技术体系建立微服务应用,为用户提供定制化的服务。

图片 2png.png

但由于业务线的日益庞大、分布在各处微服务架构以及用户体量的不断攀升,畅捷通运维团队也遇到了一些瓶颈,如
-业务高增长,用户大体量,如何识别每一个用户的体验?是否能有数据支撑?

  • 业界生态都在提全链路追踪,如何实现高效利用?
  • 如何管理好分散在各个服务器中的微服务,并解决成本难题?
  • 安全要求常态化,安全合规的可观测性黑盒无从入手

畅捷通运维团队深挖日志数据使用场景,利用日志服务工具能力梅开二度,为畅捷通的业务发展提供了持续且强有力的支持,保障了业务高速发展及用户体验的良好运行。

基于上述问题,阿里云为畅捷通构建了基于日志服务的深度使用方案,协助畅捷通搭建了渤海平台。
图片 3.png

用户体验感知解决方案:
基于阿里云日志服务,收集全量的用户请求日志,以租户维度对于该层面日志进行了数据加工,提取出Apdex性能分数、请求成功率分数、错误请求分析、错误请求影响租户占比等自定义指标,帮助客户构建用户健康体系。

图片 4.png

图片 5.png

用户业务链路追踪解决方案:
基于阿里云日志服务,在用户使用侧增加了二维码上报功能,用户使用过程中遇到问题,会自动弹出二维码,用户只需将带有二维码的界面截图给问题处理人员即可,后续相关的同事只需要扫描二维码即可将用户当前环境等信息进行复现,结合建立的业务链路追踪分析模型,即可解决问题。

图片 6.png

系统管理可观测性搭建解决方案:
基于阿里云日志服务,结合各微服务和预算数据,实时可视化展分析结果,将相关的数据进行了分析提取,使得整体使用情况具备可观测性。
图片 7.png

业务安全合规解决方案:
基于阿里云日志服务,畅捷通对于好生意日志库进行了二次加工,对于商品增改操作进行实时和定时的批量检测,之后对于结果配置进行和安全模块对接,及时发现问题后,入库RDS,相应通知到人工进行后续操作,极大的降低了业务风险,提升了业务安全合规比率。
图片 8.png

阿里云采用了日志服务,帮助畅捷通构建了用户体验感知、业务安全合规、用户业务链路追踪、成本预算的使用场景,实现了对用户、业务、成本、安全等方面的全维度感知,使得运维效率提升了30%。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
5月前
|
Java 监控 自然语言处理
一站式链路追踪:阿里云的端到端解决方案
端到端链路追踪是覆盖全部关联 IT 系统,能够完整记录用户行为在系统间调用路径与状态的最佳实践方案。而真正实现端到端链路追踪,需要解决三个难题:链路插桩、链路采集与加工、链路上下文透传。阿里云 ARMS 目前已支持全链路端到端追踪,快来查看转发吧~
61269 12
|
监控 算法 机器人
币安网格交易机器人策略开发部署源码规则解析
币安网格交易机器人策略开发部署源码规则解析
|
6月前
|
存储 数据采集 监控
智慧工地整体方案,实现现场各类工况数据采集、存储、分析与应用
“智慧工地整体方案”以智慧工地物联网云平台为核心,基于智慧工地物联网云平台与现场多个子系统的互联,实现现场各类工况数据采集、存储、分析与应用。通过接入智慧工地物联网云平台的多个子系统板块,根据现场管理实际需求灵活组合,实现一体化、模块化、智能化、网络化的施工现场过程全面感知、协同工作、智能分析、风险预控、知识共享、互联互通等业务,全面满足建筑施工企业精细化管理的业务需求,智能化地辅助建筑施工企业进行科学决策,促进施工企业监管水平的全面提高。
360 0
|
监控 BI 定位技术
直播程序源码开发建设:洞察全局,数据统计与分析功能
数据统计与分析功能不管是对直播程序源码平台的主播或运营者都会有极大的帮助,是了解观众需求、优化用户体验成为直播平台发展的关键功能,这也是开发搭建直播程序源码平台的必备功能之一。
直播程序源码开发建设:洞察全局,数据统计与分析功能
|
人工智能 供应链 安全
一物一码防伪溯源系统源码,支持正向追踪,逆向溯源
一物一码防伪溯源系统能准确获取产品生产经营各个环节的真实信息,利用物联网、云计算 、区块链、人工智能、5G等先进技术,结合特有的码码关联和RSA加密验证技术,建立区块链的“身份证”,针对产品生长到销售各环节的质量安全数据进行及时采集上传,数据具有不可逆,不可篡改等特点,实现产品溯源追踪、防窜货、产品促销等功能。
556 0
一物一码防伪溯源系统源码,支持正向追踪,逆向溯源
|
存储 缓存 前端开发
基于Otel的前端全链路追踪思考和实践
本文内容是笔者基于 GOTC 2023 全球开源技术峰会整理。前端为什么要接入链路追踪大家都应该经历过这样的事情:某一个页面或者某一个请求比较慢,前后端分别调查后数据对不上,或者很难说明差异的来源是由什么造成的,这就是单点监控带来的问题。然后是问题定位,前端作为系统的出入口,导致很多团队问题一般界线模棱两可的问题都会交给前端去定位,相信很容前端应该都经历过这样的痛苦,而作为前端也只能人肉的去分析这
5592 0
基于Otel的前端全链路追踪思考和实践
|
运维 安全 fastjson
【干货】自动化批量挖洞流程 之 四工具联动
【干货】自动化批量挖洞流程 之 四工具联动
697 0
研发管理-ucp整理-效能工具-状态流转总结
研发管理-ucp整理-效能工具-状态流转总结
63 0
研发管理-ucp整理-效能工具-状态流转总结
|
存储 运维 监控
业务全链路追踪最佳实践|学习笔记
快速学习业务全链路追踪最佳实践
业务全链路追踪最佳实践|学习笔记
|
存储 运维 监控
企业如何从 0 到 1 构建整套全链路追踪体系
今天,我来跟大家分享 ARMS 在全链路追踪领域的最佳实践,分享主要分为四部分。首先,是对分布式链路追踪的整体简介。其次,是对 ARMS 在分布式链路追踪领域的核心能力进行介绍。然后,介绍如何从 0 到 1 构建整套全链路追踪体系。最后,介绍一些最佳实践案例。
企业如何从 0 到 1 构建整套全链路追踪体系