微服务链路追踪原理，一文搞懂！

2024-11-17 993

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文重点讲解微服务链路追踪（Microservices Distributed Tracing），介绍其原理、架构及工作流程。关注【mikechen的互联网架构】，10年+BAT架构经验倾囊相授。

关注△mikechen的互联网架构△，10年+BAT架构经验倾囊相授

大家好，我是 mikechen | 陈睿。

随着微服务系统拆分后，急需链路追踪有故障的服务，今天就重点讲解微服务链路追踪@mikechen

什么是微服务链路追踪

微服务链路追踪，全称是Microservices Distributed Tracing，是在分布式系统中跟踪和监控微服务间相互调用的过程的一种技术手段。

为什么用微服务链路追踪？

随着业务访问量越来越大，比如：典型的淘宝从早期的单体开始往分布式微服务演变，系统也随之进行各种拆分，看似简单的一个应用，后台可能有几十个甚至几百个服务在支撑。

一个前端的请求，比如：一次下订单请求，可能需要多次的服务调用：商品、用户、店铺等系统调用过程，最后才能完成。

当请求变慢或者不可用时，我们无法得知是哪个后台服务引起的，这时就需要解决如何快速定位服务故障点。

主要解决以下3点问题：

1.动态展示服务的链路；

2.分析服务链路的瓶颈并对其进行调优；

3.快速进行服务链路的故障发现。

微服务链路追踪有哪些？

目前市面上的链路追踪组件有：Zipkin分布式跟踪系统，以及Naver的Pinpoint、Apache的HTrace、阿AL里的鹰眼Tracing、京J东的Hydra、新X浪的Watchman，美M团点评的CAT，Skywalking等。

微服务链路追踪的原理

这里我就以Zipkin为例给大家讲解下具体的链路追踪的原理，当然，你如果用别的分布式跟踪系统，链路追踪的原理也是大同小异的。

我以Zipkin为例，谈谈链路追踪的原理。

1.ZipKin架构

ZipKin可以分为两部分：

一部分是ZipKin Server：用来作为数据的采集存储、数据分析与展示；

一部分是ZipKin Client：基于不同的语言及框架封装的一些列客户端工具，这些工具完成了追踪数据的生成与上报功能。

整体架构如下：

2.Zipkin核心组件

zipkin(服务端)包含四个组件，分别是collector、storage、search、web UI。

1)collector(信息收集器)

collector接受或者收集各个应用传输的数据。

2)storage(存储组件)

zipkin 默认直接将数据存在内存中，此外支持使用Cassandra、ElasticSearch 和 Mysql。

3)search (查询进程)

它提供了简单的JSON API来供外部调用查询。

4)web UI (服务端展示平台)

主要是提供简单的web界面，用图表将链路信息清晰地展示给开发人员。

3.Zipkin核心结构

当用户发起一次调用时，Zipkin 的客户端会在入口处为整条调用链路生成一个全局唯一的 trace id，并为这条链路中的每一次分布式调用生成一个 span id。

一个 trace 由一组 span 组成，可以看成是由 trace 为根节点，span 为若干个子节点的一棵树，如下图所示：

4.Zipkin的工作流程

一个应用的代码发起HTTP get请求，经过Trace框架拦截，大致流程如下图所示:

1）把当前调用链的Trace信息添加到HTTP Header里面；

2）记录当前调用的时间戳；

3）发送HTTP请求，把trace相关的header信息携带上；

4）调用结束之后，记录当前调用话费的时间；

5）然后把上面流程产生的信息汇集成一个span，把这个span信息上传到zipkin的Collector模块。

以上，是微服务链路追踪原理的详细解析，欢迎评论区留言交流或拓展。

我是 mikechen | 陈睿，关注【mikechen的互联网架构】，10年+BAT架构技术倾囊相授。

本文已同步我的技术博客 www.mikechen.cc，更新至我原创的《30W+字大厂架构技术合集》中。

相关实践学习

分布式链路追踪Skywalking

Skywalking是一个基于分布式跟踪的应用程序性能监控系统，用于从服务和云原生等基础设施中收集、分析、聚合以及可视化数据，提供了一种简便的方式来清晰地观测分布式系统，具有分布式追踪、性能指标分析、应用和服务依赖分析等功能。分布式追踪系统发展很快，种类繁多，给我们带来很大的方便。但在数据采集过程中，有时需要侵入用户代码，并且不同系统的 API 并不兼容，这就导致了如果希望切换追踪系统，往往会带来较大改动。OpenTracing为了解决不同的分布式追踪系统 API 不兼容的问题，诞生了 OpenTracing 规范。OpenTracing 是一个轻量级的标准化层，它位于应用程序/类库和追踪或日志分析程序之间。Skywalking基于OpenTracing规范开发，具有性能好，支持多语言探针，无侵入性等优势，可以帮助我们准确快速的定位到线上故障和性能瓶颈。在本套课程中，我们将全面的讲解Skywalking相关的知识。从APM系统、分布式调用链等基础概念的学习加深对Skywalking的理解，从0开始搭建一套完整的Skywalking环境，学会对各类应用进行监控，学习Skywalking常用插件。Skywalking原理章节中，将会对Skywalking使用的agent探针技术进行深度剖析，除此之外还会对OpenTracing规范作整体上的介绍。通过对本套课程的学习，不止能学会如何使用Skywalking，还将对其底层原理和分布式架构有更深的理解。本课程由黑马程序员提供。

微服务链路追踪原理，一文搞懂！

什么是微服务链路追踪

为什么用微服务链路追踪？

微服务链路追踪有哪些？

微服务链路追踪的原理

1.ZipKin架构

2.Zipkin核心组件

3.Zipkin核心结构

4.Zipkin的工作流程

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

微服务链路追踪原理，一文搞懂！

什么是微服务链路追踪

为什么用微服务链路追踪？

微服务链路追踪有哪些？

微服务链路追踪的原理

1.ZipKin架构

2.Zipkin核心组件

3.Zipkin核心结构

4.Zipkin的工作流程

热门文章

最新文章

相关课程

相关电子书

相关实验场景