告别日志查询 | 阿里云发布链路追踪服务Tracing Analysis

简介: 近日,在杭州云栖大会上,阿里云发布了链路追踪服务Tracing Analysis,成本是自建链路追踪系统的1/5或更少,可为分布式应用的开发者提供完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等工具,帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提高微服务时代下的开发诊断效率。

近日,在杭州云栖大会上,阿里云发布了链路追踪服务Tracing Analysis,成本是自建链路追踪系统的1/5或更少,可为分布式应用的开发者提供完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等工具,帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提高微服务时代下的开发诊断效率。


tracing_analysisi

Tracing Analysis 传送门:https://www.aliyun.com/product/xtrace

微服务时代,分布式应用架构虽然满足了应用横向扩展的需求,但是运维和诊断的过程变得越来越复杂,例如会遇到接口诊断困难、应用性能诊断复杂、架构分析复杂、多语言程序接入难统一、调用链路数据离线分析困难等难题。传统的监控工具并无法满足提供跨越不同服务的能见度需求。

阿里云链路追踪服务Tracing Analysis可以跟踪所有分布式架构中的微服务用户请求,汇总组成分布式调用链方式,以及应用程序的单个服务和资源,实现调研链路的查询、诊断和应用性能实时汇总功能。同时,收集到的链路数据,可直接应用在日志分析中,并可对接到下游分析平台如LogSearch、CloudMonitor、MaxCompute等,用于离线分析、报警等场景,提升链路数据价值。此外,tracing analysis基于Opentracing标准,全面兼容开源社区,如Jaeger, Zipkin等开源项目,提高链路追踪系统的可用性和稳健性。

_2018_09_17_3_38_26

据链路追踪服务产品专家伏羿介绍,链路追踪Tracing Analysis 和 业务实时监控ARMS 是阿里云上应用侧APM监控的双引擎, 两款产品都可以满足用户在分布式应用场景下的复杂链路诊断需求,但支持场景有所不同:

  • 业务实时监控ARMS

采用业界比较流行的无侵入式监控埋点,用户无需改造就可以深度监控和诊断到用户应用;但是无侵入式埋点虽然功能强大,实现逻辑却相对复杂、成本相对较高,而且受限于开发语言特性,某些语言如C, Go等就无法支持无侵入式埋点。

  • 链路追踪Tracing Analysis

针对用户多语言的应用监控需求,阿里云特此推出链路追踪通过基于开放标准(opentracing)和开源组件(Jaeger, Zipkin, etc)侵入式埋点方式填补了这方面的空白;基于链路追踪,用户可以以比较低的性能代价通过嵌入链路追踪的SDK来手动上报链路信息,从而快速实现异构多语言分布式架构下的链路追踪需求。
相比于业务实时监控,虽然链路追踪接入比较负责,用户需要手动埋点,但是产品本身基于开放标准和开源产品,对用户无lock-in问题,而且成本相对低廉,链路追踪本身免费,用户仅对链路追踪依赖的日志服务成本进行付费。

此次阿里云链路追踪服务Tracing Analysis的发布,旨在帮助用户和各类开发者降低分布式系统的运维难度,聚焦业务创新,不用重复造轮子。同时,作为阿里云互联网中间件整体解决方案的重要组成部分,结合企业级分布式应用服务EDAS、消息队列MQ、应用配置管理ACM、性能测试PTS、业务实时监控服务ARMS等核心互联网中间件产品,可以快速搭建企业级互联网架构平台,具备业务中台能力,促进企业数字化转型的快速落地。

相关实践学习
通过轻量消息队列(原MNS)主题HTTP订阅+ARMS实现自定义数据多渠道告警
本场景将自定义告警信息同时分发至多个通知渠道的需求,例如短信、电子邮件及钉钉群组等。通过采用轻量消息队列(原 MNS)的主题模型的HTTP订阅方式,并结合应用实时监控服务提供的自定义集成能力,使得您能够以简便的配置方式实现上述多渠道同步通知的功能。
相关文章
|
8月前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
469 91
|
4月前
|
存储 缓存 Apache
StarRocks+Paimon 落地阿里日志采集:万亿级实时数据秒级查询
本文介绍了阿里集团A+流量分析平台的日志查询优化方案,针对万亿级日志数据的写入与查询挑战,提出基于Flink、Paimon和StarRocks的技术架构。通过Paimon存储日志数据,结合StarRocks高效计算能力,实现秒级查询性能。具体包括分桶表设计、数据缓存优化及文件大小控制等措施,解决高并发、大数据量下的查询效率问题。最终,日志查询耗时从分钟级降至秒级,显著提升业务响应速度,并为未来更低存储成本、更高性能及更多业务场景覆盖奠定基础。
|
7月前
|
监控 Java Go
阿里云可观测全面拥抱 OpenTelemetry 社区
阿里云作为全球领先的云服务商,始终站在开源观测技术最前沿。深度参与 OTel 社区,坚定支持技术开放生态与全球兼容性技术标准的构建。
211 88
|
4月前
|
自然语言处理 监控 安全
阿里云发布可观测MCP!支持自然语言查询和分析多模态日志
阿里云可观测官方发布了Observable MCP Server,提供了一系列访问阿里云可观测各产品的工具能力,包含阿里云日志服务SLS、阿里云应用实时监控服务ARMS等,支持用户通过自然语言形式查询
451 0
阿里云发布可观测MCP!支持自然语言查询和分析多模态日志
|
6月前
|
存储 消息中间件 缓存
MiniMax GenAI 可观测性分析 :基于阿里云 SelectDB 构建 PB 级别日志系统
基于阿里云SelectDB,MiniMax构建了覆盖国内及海外业务的日志可观测中台,总体数据规模超过数PB,日均新增日志写入量达数百TB。系统在P95分位查询场景下的响应时间小于3秒,峰值时刻实现了超过10GB/s的读写吞吐。通过存算分离、高压缩比算法和单副本热缓存等技术手段,MiniMax在优化性能的同时显著降低了建设成本,计算资源用量降低40%,热数据存储用量降低50%,为未来业务的高速发展和技术演进奠定了坚实基础。
240 1
MiniMax GenAI 可观测性分析 :基于阿里云 SelectDB 构建 PB 级别日志系统
|
6月前
|
监控 Java Go
阿里云可观测全面拥抱 OpenTelemetry 社区
阿里云可观测全面拥抱 OpenTelemetry 社区
116 1
阿里云可观测全面拥抱 OpenTelemetry 社区
|
6月前
|
域名解析 应用服务中间件 网络安全
阿里云个人博客外网访问中断应急指南:从安全组到日志的七步排查法
1. 检查安全组配置:确认阿里云安全组已开放HTTP/HTTPS端口,添加规则允许目标端口(如80/443),授权对象设为`0.0.0.0/0`。 2. 本地防火墙设置:确保服务器防火墙未阻止外部流量,Windows启用入站规则,Linux检查iptables或临时关闭防火墙测试。 3. 验证Web服务状态:检查Apache/Nginx/IIS是否运行并监听所有IP,使用命令行工具确认监听状态。 4. 测试网络连通性:使用外部工具和内网工具测试服务器端口是否开放,排除本地可访问但外网不可的问题。 5. 排查DNS解析:确认域名A记录指向正确公网IP,使用`ping/nslookup`验证解析正
206 2
|
6月前
|
SQL 存储 自然语言处理
让跨 project 联查更轻松,SLS StoreView 查询和分析实践
让跨 project 联查更轻松,SLS StoreView 查询和分析实践
112 1
|
8月前
|
存储 人工智能 JSON
RAG Logger:专为检索增强生成(RAG)应用设计的开源日志工具,支持查询跟踪、性能监控
RAG Logger 是一款专为检索增强生成(RAG)应用设计的开源日志工具,支持查询跟踪、检索结果记录、LLM 交互记录和性能监控等功能。
320 7
RAG Logger:专为检索增强生成(RAG)应用设计的开源日志工具,支持查询跟踪、性能监控
|
6月前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
网络安全视角:从地域到账号的阿里云日志审计实践
118 0