如何用阿里云实行全链路数据追踪

本文涉及的产品
对象存储 OSS,OSS 加速器 50 GB 1个月
简介: 阿里云采用了日志服务,帮助畅捷通构建了用户体验感知、业务安全合规、用户业务链路追踪、成本预算的使用场景,实现了对用户、业务、成本、安全等方面的全维度感知,使得运维效率提升了30%。

在日常生活中,遇到电脑卡、迟缓等问题,我们都会下意识地觉得“电脑坏了”,我们会介意每一秒的延迟带来的等待,等待的这一秒可能会让你输了这场比赛、损失一笔交易、错过一段爱情……。因此为了改善这一秒的延迟,我们会认真仔细地检查系统、硬件、网络等。也会为了这一秒的延迟,花重金来升级设备。在日常生活中,我们对于“慢”可谓是深恶痛疾,而企业又何尝不是呢?

随着互联网的以及基础设施的发展,越来越多的企业将业务搬到线上,业务数字化已经在各个行业得到广泛应用,推动各行业的业务创新,提升了用户体验和效率。在业务往数据化转型的浪潮下,企业业务就面临以下四个趋势:

  1. 体验是关键的竞争力之一:统计结果,发现1秒的延迟增加,平均会带来7%的用户流失。
  2. 创新迭代在加速::55%的应用,每周甚至是每天,都会发布更新。
  3. 基础实施与架构在革新:多数企业业务采用了新型架构,这些变化,让业务更敏捷迭代,并可支撑更加复杂的业务、提升运营效率。
  4. 运维数据的多样化:包括运维数据容量、可变性、种类都在增加,比如日志/指标/链路/审计/CMDB等。

图片 1.png

从以上四个趋势得出,如何提升用户体验,让业务快速且稳定地为用户服务,是企业在这个时代发展的关键。而“慢”,对于企业来说,就是一种故障。慢一秒可能会损失大量的用户、慢一秒可能会让服务器崩溃、慢一秒可能会被市场淘汰汰。

但更好的用户体验也意味着更高的投入,让IT设施成为企业发展中累赘是一件很不明智的事情。那企业该如何克服这类问题呢?

针对这类问题,“微服务”应运而生。传统的IT架构大多都是各种独立系统的堆砌,这些系统的问题总结来说就是扩展性差,可靠性不高,维护成本高。但使用微服务架构后,越来越多的系统被拆解成了多个微服务。企业可将大量通用功能下沉为服务,并对服务不断进行拆分,再根据不同的业务形态,快速组装出前端应用,通过服务组装和聚合的方式实现更快的开发速度,前端也能变得更轻。

但大量的微服务,使得整体运维难度也会提升,不同的微服务可能会带来不同类型的数据、大量的警告以及处理不完的故障。那么能否有简单的方式,来对大量的微服务进行管理呢?

畅捷通信息技术股份有限公司是用友旗下成员企业,致力于为小微企业提供社交化、个性化、服务化、小量化的生意管理支持。畅捷通充分利用SaaS业务与客户的高频互动的优势深挖客户的价值,从而多方面满足小微企业对云产品的需求。畅捷通提出以畅捷通T+为核心的“云+端”战略,以数智财税、数智商业为核心,以数据服务与生态服务为延展,通过Spring Cloud技术体系建立微服务应用,为用户提供定制化的服务。

图片 2png.png

但由于业务线的日益庞大、分布在各处微服务架构以及用户体量的不断攀升,畅捷通运维团队也遇到了一些瓶颈,如
-业务高增长,用户大体量,如何识别每一个用户的体验?是否能有数据支撑?

  • 业界生态都在提全链路追踪,如何实现高效利用?
  • 如何管理好分散在各个服务器中的微服务,并解决成本难题?
  • 安全要求常态化,安全合规的可观测性黑盒无从入手

畅捷通运维团队深挖日志数据使用场景,利用日志服务工具能力梅开二度,为畅捷通的业务发展提供了持续且强有力的支持,保障了业务高速发展及用户体验的良好运行。

基于上述问题,阿里云为畅捷通构建了基于日志服务的深度使用方案,协助畅捷通搭建了渤海平台。
图片 3.png

用户体验感知解决方案:
基于阿里云日志服务,收集全量的用户请求日志,以租户维度对于该层面日志进行了数据加工,提取出Apdex性能分数、请求成功率分数、错误请求分析、错误请求影响租户占比等自定义指标,帮助客户构建用户健康体系。

图片 4.png

图片 5.png

用户业务链路追踪解决方案:
基于阿里云日志服务,在用户使用侧增加了二维码上报功能,用户使用过程中遇到问题,会自动弹出二维码,用户只需将带有二维码的界面截图给问题处理人员即可,后续相关的同事只需要扫描二维码即可将用户当前环境等信息进行复现,结合建立的业务链路追踪分析模型,即可解决问题。

图片 6.png

系统管理可观测性搭建解决方案:
基于阿里云日志服务,结合各微服务和预算数据,实时可视化展分析结果,将相关的数据进行了分析提取,使得整体使用情况具备可观测性。
图片 7.png

业务安全合规解决方案:
基于阿里云日志服务,畅捷通对于好生意日志库进行了二次加工,对于商品增改操作进行实时和定时的批量检测,之后对于结果配置进行和安全模块对接,及时发现问题后,入库RDS,相应通知到人工进行后续操作,极大的降低了业务风险,提升了业务安全合规比率。
图片 8.png

阿里云采用了日志服务,帮助畅捷通构建了用户体验感知、业务安全合规、用户业务链路追踪、成本预算的使用场景,实现了对用户、业务、成本、安全等方面的全维度感知,使得运维效率提升了30%。

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
5月前
|
人工智能 安全 数据可视化
面向业务落地的AI产品评测体系设计与平台实现
在AI技术驱动下,淘宝闪购推进AI应用落地,覆盖数字人、数据分析、多模态创作与搜推AI化四大场景。面对研发模式变革与Agent链路复杂性,构建“评什么、怎么评、如何度量”的评测体系,打造端到端质量保障平台,并规划多模态评测、可视化标注与插件市场,支撑业务持续创新。
1146 38
|
7月前
|
存储 人工智能 运维
日志服务&云监控全新发布,共筑企业智能运维新范式
阿里云推出Operation Intelligence新范式,通过日志服务SLS与云监控2.0,实现从感知、认知到行动闭环,推动运维迈向自决策时代。
583 1
日志服务&云监控全新发布,共筑企业智能运维新范式
|
2月前
|
人工智能 JavaScript 程序员
再也不用加班!OpenClaw零基础部署+集成6大岗位18个高价值专属Skill,工作效率提升60%
2026年,AI Agent的落地速度远超预期,从新媒体运营到程序员,从产品经理到HR,几乎每个岗位都能通过专属技能(Skill)实现工作自动化。QuestMobile 2025年数据显示,82%的新媒体团队已引入AI工具,效率平均提升60%;Stack Overflow 2025年调研也提到,78%的程序员使用AI工具辅助开发,每天平均节省2-3小时。
1116 4
|
9月前
|
XML JSON Java
Spring框架中常见注解的使用规则与最佳实践
本文介绍了Spring框架中常见注解的使用规则与最佳实践,重点对比了URL参数与表单参数的区别,并详细说明了@RequestParam、@PathVariable、@RequestBody等注解的应用场景。同时通过表格和案例分析,帮助开发者正确选择参数绑定方式,避免常见误区,提升代码的可读性与安全性。
|
存储 监控 数据可视化
双十一线上服务调用链路追踪SkyWalking实战分析
【11月更文挑战第27天】随着电商行业的飞速发展,双十一购物节已成为全球最大的购物狂欢节之一。在双十一期间,电商平台需要处理海量的用户请求和订单,这对系统的稳定性和性能提出了极高的要求。为了确保系统在高并发环境下的稳定运行,对线上服务的调用链路进行追踪和分析显得尤为重要。本文将通过实战案例,详细介绍如何在双十一期间使用SkyWalking对线上服务进行调用链路追踪,并结合Seata实现分布式事务管理,从而保障系统的稳定性和性能。
465 6
|
Linux Python
linux之部署python环境&创建虚拟环境
linux之部署python环境&创建虚拟环境
|
存储 开发框架 监控
一个轻量级的实时监控工具---WatchDog
一个轻量级的实时监控工具---WatchDog
547 0
|
机器学习/深度学习 测试技术 计算机视觉
注意力机制汇总,包括SE、CBAM、ECA等
注意力机制汇总,包括SE、CBAM、ECA等
2639 1
|
消息中间件 API RocketMQ
你的RocketMQ消费者组(Consumer Group)在查看时显示为离线,这可能是由于消费者组的状态没有被正确更新
你的RocketMQ消费者组(Consumer Group)在查看时显示为离线,这可能是由于消费者组的状态没有被正确更新【1月更文挑战第10天】【1月更文挑战第49篇】
2272 5
【在Mac电脑上录制视频,并快速转成GIF!!!超级好用,强烈推荐GIF Brewery,内附下载链接。】
【在Mac电脑上录制视频,并快速转成GIF!!!超级好用,强烈推荐GIF Brewery,内附下载链接。】

热门文章

最新文章