一文打通Sleuth+Zipkin 服务链路追踪-阿里云开发者社区

一文打通Sleuth+Zipkin 服务链路追踪

2023-07-25 392

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 一文打通Sleuth+Zipkin 服务链路追踪

1、为什么用

微服务架构是一个分布式架构，它按业务划分服务单元，一个分布式系统往往有很多个服务单元。由于服务单元数量众多，业务的复杂性，如果出现了错误和异常，很难去定位。主要体现在，一个请求可能需要调用很多个服务，而内部服务的调用复杂性，决定了问题难以定位。所以微服务架构中，必须实现分布式链路追踪，去跟进一个请求到底有哪些服务参与，参与的顺序又是怎样的，从而达到每个请求的步骤清晰可见，出了问题，很快定位。

链路追踪组件有 Google 的 Dapper，Twitter 的 Zipkin，以及阿里的 Eagleeye （鹰眼）等，它们都是非常优秀的链路追踪开源组件。

2、基本术语

 Span（跨度）：基本工作单元，发送一个远程调度任务就会产生一个 Span，Span 是一个 64 位 ID 唯一标识的，Trace 是用另一个 64 位 ID 唯一标识的，Span 还有其他数据信息，比如摘要、时间戳事件、Span 的 ID、以及进度 ID。

 Trace（跟踪）：一系列 Span 组成的一个树状结构。请求一个微服务系统的 API 接口，这个 API 接口，需要调用多个微服务，调用每个微服务都会产生一个新的 Span，所有由这个请求产生的 Span 组成了这个 Trace。

 Annotation（标注）：用来及时记录一个事件的，一些核心注解用来定义一个请求的开始和结束。这些注解包括以下：

 cs - Client Sent -客户端发送一个请求，这个注解描述了这个 Span 的开始

 sr - Server Received -服务端获得请求并准备开始处理它，如果将其 sr 减去 cs 时间戳便可得到网络传输的时间。

 ss - Server Sent （服务端发送响应）–该注解表明请求处理的完成(当请求返回客户端)，如果 ss 的时间戳减去 sr 时间戳，就可以得到服务器请求的时间。

 cr - Client Received （客户端接收响应）-此时 Span 的结束，如果 cr 的时间戳减去cs 时间戳便可以得到整个请求所消耗的时间。

官方文档：

1. https://cloud.spring.io/spring-cloud-static/spring-cloud-sleuth/2.1.3.RELEASE/single/spring-cloud
2. -sleuth.html

如果服务调用顺序如下

那么用以上概念完整的表示出来如下：

Span 之间的父子关系如下：

3、整合 Sleuth

1、服务提供者与消费者导入依赖

1. <dependency>
2. <groupId>org.springframework.cloud</groupId>
3. <artifactId>spring-cloud-starter-sleuth</artifactId>
4. </dependency>

2、打开 debug 日志

1. logging:
2.     level:
3.         org.springframework.cloud.openfeign: debug
4.         org.springframework.cloud.sleuth: debug

3、发起一次远程调用，观察控制台

DEBUG [user-service,541450f08573fff5,541450f08573fff5,false] user-service：服务名

541450f08573fff5：是 TranceId，一条链路中，只有一个 T

ranceId 541450f08573fff5：是 spanId，链路中的基本工作单元 id

false：表示是否将数据输出到其他服务，true 则会把信息输出到其他可视化的服务上观察

4、整合 zipkin 可视化观察

通过 Sleuth 产生的调用链监控信息，可以得知微服务之间的调用链路，但监控信息只输出到控制台不方便查看。我们需要一个图形化的工具-zipkin。Zipkin 是 Twitter 开源的分布式跟踪系统，主要用来收集系统的时序数据，从而追踪系统的调用问题。

zipkin 官网地址如下

https://zipkin.io/

1、docker 安装 zipkin 服务器

docker run -d -p 9411:9411 openzipkin/zipkin

2、pom导入

1. <dependency>
2. <groupId>org.springframework.cloud</groupId>
3. <artifactId>spring-cloud-starter-zipkin</artifactId>
4. </dependency>

zipkin 依赖也同时包含了 sleuth，可以省略 sleuth 的引用

3、添加 zipkin 相关配置

1. spring:
2.     application:
3.         name: user-service
4.     zipkin:
5.     base-url: http://192.168.56.10:9411/ # zipkin 服务器的地址
6.     # 关闭服务发现，否则 Spring Cloud 会把 zipkin 的 url 当做服务名称
7.     discoveryClientEnabled: false
8.     sender:
9. type: web # 设置使用 http 的方式传输数据
10.     sleuth:
11.         sampler:
12.             probability: 1 # 设置抽样采集率为 100%，默认为 0.1，即 10%

发送远程请求，测试 zipkin。

服务调用链追踪信息统计

服务依赖信息统计

5、Zipkin 数据持久化

Zipkin 默认是将监控数据存储在内存的，如果 Zipkin 挂掉或重启的话，那么监控数据就会丢失。所以如果想要搭建生产可用的 Zipkin，就需要实现监控数据的持久化。而想要实现数据持久化，自然就是得将数据存储至数据库。好在 Zipkin 支持将数据存储至：

 内存（默认）

 MySQL

 Elasticsearch

 Cassandra

Zipkin 数据持久化相关的官方文档地址如下：

Zipkin 支持的这几种存储方式中，内存显然是不适用于生产的，这一点开始也说了。而使用MySQL 的话，当数据量大时，查询较为缓慢，也不建议使用。Twitter 官方使用的是 Cassandra作为 Zipkin 的存储数据库，但国内大规模用 Cassandra 的公司较少，而且 Cassandra 相关文档也不多。Zipkin-server不处理跟踪数据的保留管理。使用ElasticSearch推荐的工具管理数据保留或群集会无限增长！（这使用Elasticsearch 5 + 功能） 综上，故采用 Elasticsearch 是个比较好的选择，关于使用 Elasticsearch 作为 Zipkin 的存储数据库的官方文档如下：

elasticsearch-storage：

zipkin-storage/elasticsearch：

通过 docker 的方式：

1. docker run --env STORAGE_TYPE=elasticsearch --env ES_HOSTS=192.168.56.10:9200
2. openzipkin/zipkin-dependencies

使用 es 时 Zipkin Dependencies 支持的环境变量

相关实践学习

分布式链路追踪Skywalking

Skywalking是一个基于分布式跟踪的应用程序性能监控系统，用于从服务和云原生等基础设施中收集、分析、聚合以及可视化数据，提供了一种简便的方式来清晰地观测分布式系统，具有分布式追踪、性能指标分析、应用和服务依赖分析等功能。分布式追踪系统发展很快，种类繁多，给我们带来很大的方便。但在数据采集过程中，有时需要侵入用户代码，并且不同系统的 API 并不兼容，这就导致了如果希望切换追踪系统，往往会带来较大改动。OpenTracing为了解决不同的分布式追踪系统 API 不兼容的问题，诞生了 OpenTracing 规范。OpenTracing 是一个轻量级的标准化层，它位于应用程序/类库和追踪或日志分析程序之间。Skywalking基于OpenTracing规范开发，具有性能好，支持多语言探针，无侵入性等优势，可以帮助我们准确快速的定位到线上故障和性能瓶颈。在本套课程中，我们将全面的讲解Skywalking相关的知识。从APM系统、分布式调用链等基础概念的学习加深对Skywalking的理解，从0开始搭建一套完整的Skywalking环境，学会对各类应用进行监控，学习Skywalking常用插件。Skywalking原理章节中，将会对Skywalking使用的agent探针技术进行深度剖析，除此之外还会对OpenTracing规范作整体上的介绍。通过对本套课程的学习，不止能学会如何使用Skywalking，还将对其底层原理和分布式架构有更深的理解。本课程由黑马程序员提供。

一文打通Sleuth+Zipkin 服务链路追踪

1、为什么用

2、基本术语

官方文档：

3、整合 Sleuth

1、服务提供者与消费者导入依赖

2、打开 debug 日志

3、发起一次远程调用，观察控制台

4、整合 zipkin 可视化观察

zipkin 官网地址如下

1、docker 安装 zipkin 服务器

2、pom导入

3、添加 zipkin 相关配置

5、Zipkin 数据持久化

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

一文打通Sleuth+Zipkin 服务链路追踪

1、为什么用

2、基本术语

官方文档：

3、整合 Sleuth

1、服务提供者与消费者导入依赖

2、打开 debug 日志

3、发起一次远程调用，观察控制台

4、整合 zipkin 可视化观察

zipkin 官网地址如下

1、docker 安装 zipkin 服务器

2、pom导入

3、添加 zipkin 相关配置

5、Zipkin 数据持久化

热门文章

最新文章

相关课程

相关电子书