开发者社区> 中间件小哥> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

开发者说:Seata 0.7.0 版本,你 get 'Metrics' 技能了吗?

简介: 从用户的视角来感受一个开源项目的成长,是我们推出「开发者说」专栏的初衷,即在开发者进行开源项目选型时,提供更为立体的项目信息。专栏所有内容均来自作者原创/投稿,本文是「开发者说」的第9篇,作者郑扬勇,云粒智慧技术专家,开源爱好者,关注微服务、IOT领域技术,希望通过参与开源帮助别人的同时帮助自己。
+关注继续查看

从用户的视角来感受一个开源项目的成长,是我们推出「开发者说」专栏的初衷,即在开发者进行开源项目选型时,提供更为立体的项目信息。专栏所有内容均来自作者原创/投稿,本文是「开发者说」的第9篇,作者郑扬勇,云粒智慧技术专家,开源爱好者,关注微服务、IOT领域技术,希望通过参与开源帮助别人的同时帮助自己。

Seata 0.7.0版本中将包含全新的特性 - Metrics,作为 APM(Application Performance Management & Monitoring)三大基石之一,通过它可以快速详尽的获取到TC、TM(规划中)和RM(规划中)中事务的活动状态以及时延等重要统计信息。

设计思路

  1. Seata 作为一个被集成的数据一致性框架,Metrics 模块将尽可能少的使用第三方依赖以降低发生冲突的风险;例如不使用 Spring Bean 机制,而是使用SPI(Service Provider Interface) 加载扩展。
  2. Metrics 模块将竭力争取更高的度量性能和更低的资源开销,尽可能降低开启后带来的副作用;
  3. 配置式,Metrics 是否激活、数据如何发布,取决于对应的配置;
  4. 开始仅在 TC 中完成核心 Transaction 相关指标的实现,之后结合社区的需求,逐步完善运维所需的其他指标。

模块说明

Seata Metrics 的模块全部在seata-metrics下,0.7版本包含:

lALPDgQ9q2weDuPNAZDNAu8_751_400_png_620x10000q90g

由2个核心 API 模块 seata-metrics-api和seata-metrics-core,以及N个实现模块,例如:seata-metrics-registry-compact、seata-metrics-exporter-prometheus构成:

  • seata-metrics-api 模块

此模块是 Metrics 的核心,将作为 Seata 基础架构的一部分被 TC、TM 和 RM 引用,它内部没有任何具体实现代码,仅包含接口定义,定义的内容包括:

1、Meter类接口:Gauge、Counter、Timer...

2、注册容器接口:Registry

3、Measurement 数据导出接口:Exporter

提示:Metrics 本身在开源领域也已有很多实现,例如 Netflix-Spectator、Dropwizard-Metrics、Dubbo-Metrics。它们有的轻而敏捷,有的重而强大,由于也是“实现”,因此不会纳入seata-metrics-api中,避免实现绑定。

  • seata-metrics-core 模块
    Metrics核心模块,根据配置组织(加载)1个Registry和N个Exporter;
  • seata-metrics-registry-compact 模块
    这是我们提供的默认(内置)的Registry实现,不使用其它Metrics开源库,轻量级的实现了以下四种Meter:
Meter类型 描述
CompactGauge 单一最新值度量器
CompactCounter 单一累加度量器,可增可减
CompactSummary 多Measurement输出计数器,将输出total(合计)、count(计数)、max(最大)、average(合计/计数)和tps(合计/时间间隔),无单位
CompactTimer 多Measurement输出计数器,将输出total(合计)、count(计数)、max(最大)、average(合计/计数),支持微秒为单位累计

其中包含的 Registry,即CompactRegistry,它只有接受 measure() 方法调用的时候才计算度量值,因此计算窗口完全取决于Exporter的实现,故目前不太适合需要多Exporter 的场景使用(如何扩展请参见后文)。

说明:未来可能增加更丰富复杂的度量器例如Histogram,这是一种可以本地统计聚合75th, 90th, 95th, 98th, 99th,99.9th...的度量器,适合某些场合,但需要更多内存。所有的计量器都将继承自Meter,所有的计量器执行 measure() 方法后,都将归一化的生成1或N个 Measurement 结果。

  • seata-metrics-exporter-prometheus模块
    Prometheus 发布器PrometheusExporter,将度量数据同步给 Prometheus。

工作原理

lALPDgQ9q2weDuXNAmPNA2c_871_611_png_620x10000q90g

TC中Metrics的初始化步骤和工作原理如下:

  1. Server 调用 MetricsManager.get().init() 启动 Metrics 的初始化;
  2. MetricsManager读取配置,通过SPI初始化对应的1个Registry和N个Exporter(分别通过RegistryFactory和ExporterFactory);
  3. 如果初始化成功,代表用户启用了 Metrics 特性,初始化 MetricsSubscriber 并注册到 EventBus;
  4. DefaultCore 和 DefaultCoordinator 根据 Transaction 的状态变化触发对应状态的事件,MetricsSubscriber 根据状态,记录对应的 Metric 至 Registry;
  5. Exporter 定期从 Registry 中获取数据,发布到外部对接的监控系统。

可以看出,Metrics 定位为一个可选特性,如果不配置,事件订阅器 MetricsSubscriber并不会创建和注册,避免无谓的性能开销。

如何使用

如果需要开启 TC 的 Metrics,需要在其配置中增加配置项:

## metrics settings metrics {   registry-type = "compact"   # multi exporters use comma divided   exporter-list = "prometheus"   exporter-prometheus-port = 9898 }

启动TC,即可在http://tc-server-ip:9898/metrics上获取到Metrics的文本格式数据。

提示:默认使用9898端口,Prometheus 已登记的端口列表在此,如果想更换端口,可通过metrics.exporter-prometheus-port配置修改。

下载并启动 Prometheus

下载完毕后,修改 Prometheus 的配置文件prometheus.yml,在scrape_configs中增加一项抓取 Seata 的度量数据:

scrape_configs:  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['localhost:9090']

  - job_name: 'seata'

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
    - targets: ['tc-server-ip:9898']

查看数据输出

推荐结合配置 Grafana 获得更好的查询效果,目前Seata导出的Metrics包括:

Metrics 描述
seata.transaction(role=tc,meter=counter,status=active/committed/rollback) 当前活动中/已提交/已回滚的事务总数
seata.transaction(role=tc,meter=counter,status=active/committed/rollback) 当前周期内提交/回滚的事务数
seata.transaction(role=tc,meter=summary,statistic=tps,status=committed/rollback) 当前周期内提交/回滚的事务TPS(transaction per second)
seata.transaction(role=tc,meter=timer,statistic=total,status=committed/rollback) 当前周期内提交/回滚的事务耗时总和
seata.transaction(role=tc,meter=timer,statistic=count,status=committed/rollback) 当前周期内提交/回滚的事务数
seata.transaction(role=tc,meter=timer,statistic=average,status=committed/rollback) 当前周期内提交/回滚的事务平均耗时
seata.transaction(role=tc,meter=timer,statistic=max,status=committed/rollback) 当前周期内提交/回滚的事务最大耗时

提示:seata.transaction(role=tc,meter=summary,statistic=count,status=committed/rollback)和seata.transaction(role=tc,meter=timer,statistic=count,status=committed/rollback)的值可能相同,但它们来源于两个不同的度量器。

如何扩展

如果有下面几种情况:

1、您不是使用 Prometheus 作为运维监控系统,但希望能够将Seata的Metrics数据集成进 Dashboard 中;

您需要实现新的Exporter,例如如果需要对接Zabbix,创建seata-metrics-exporter-zabbix模块,然后在ExporterType中添加新的Exporter类型,最后在metrics.exporter-list中配置。

2、您需要更复杂强大的度量器类型,这些度量器在其他 Metrics 实现库中已有,希望集成这些第三方依赖直接使用;

您可以不使用内置的 CompactRegistry 的实现,完全扩展一个新的Registry库,例如希望使用 Netflix Spectator 的实现,扩展名为seata-metrics-registry-spectator的模块,然后在RegistryType中添加新的Registry类型,开发完成后,设置metrics.registry-type为对应的类型。

3、您需要改变默认 Metric 的 Measurement 输出,例如在 Timer 中增加一个min或sd(方差);

您可以修改对应 Meter 的实现,包括measure()方法返回的 Measurement 列表。

未来发展

1. 为 TM 和 RM 追加 Metrics 特性:

TM:稍后实现,包括诸如:
seata.transaction(role=tm,name{GlobalTransactionalName},meter=counter,status=active/committed/rollback) : 以GlobalTransactionalName为维度区分不同Transactional的状态。

RM:稍后实现,包括诸如:
eata.transaction(role=rm,name{BranchTransactionalName},mode=at/mt,meter=counter,status=active/committed/rollback):以BranchTransactionalName为维度以及AT/MT维度区分不同分支 Transactional 的状态。

2. 响应社区,扩展更多的 Registry 和 Exporter ,以及支持更丰富的 Meter。

结束语

文介绍的 Metrics 是一个侵入式特性,如果用户希望只使用无侵入的 Metrics,则可以使用 SkyWalking 在6.3版本中增加的与 Seata 集成的方案。

「开发者说」系列文章:

1st:《深度剖析开源分布式事务方案 Seata 的事务协调器》
2nd:《RocketMQ 消息发送的高可用设计》
3st:《消息队列 Kafka 和 RocketMQ 之我见》
4th:《如何参与定义一款 IDE 插件》
5th:《基于 Nacos 的网关灰度路由和服务权重灰度》
6th:《开发者说:Sentinel 流控功能在 SpringMVC/SpringBoot 上的实践》
7th:《深度解析 RocketMQ Topic 的创建机制》
8th:《这个注解一次搞定限流与熔断降级》

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
WIN7上安装OFFICE 2019(未成功)
WIN7上安装OFFICE 2019(未成功)
57 0
SAP 电商云 Spartacus UI 4.1 版本的延迟加载技术介绍
SAP 电商云 Spartacus UI 4.1 版本的延迟加载技术介绍
35 0
Spark 2.4.0编程指南--Spark SQL UDF和UDAF
## 技能标签 - 了解UDF 用户定义函数(User-defined functions, UDFs) - 了解UDAF (user-defined aggregate function), 用户定义的聚合函数 - UDF示例(统计行数据字符长度) - UDF示例(统计行数据字符转大写) ...
6391 0
巧用OpenSSL完成md2、md4、md5、rmd160、sha、sha1等的验证
相信很多奋斗在运维战线的小伙伴们经常会遇到版本升级之类的问题。笔者之前所在的公司每次进行版本发布的时候都会附带MD5校验哈希值,每次升级之前一般都要核对MD5哈希值的,刚刚开始的时候对Linux并不是非常熟悉,每次下载完升级包之后都会在Windows环境下利用Hash工具校验之后才上传到Linux服务器上进行版本升级操作。
1443 0
《面向对象的思考过程(原书第4版)》一1.13 本章中使用的示例代码
以下是C#.NET版本的代码。其他语言(比如VB.NET和Objective-C)的代码在出版社网站上有电子版。本章已经展示了这些例子对应的Java代码。
815 0
Office版本问题0x80029C4A
说来奇怪,以前运行正常的程序(涉及excel表格输出),现在运行失败了,一调试,发现了如下问题: 无法将类型为"Microsoft.Office.Interop.Excel.ApplicationClass"的 COM 对象强制转换为接口类型"Microsoft.Office.Interop.Excel._Application"。
1362 0
SymmetricDS 2.2.5 undeploy时symmetricScheduler job线程杀不掉分析
SymmetricDS的同步机制是定时周期性同步,我们项目根据业务需要,只需要客户在UI激活一次replication时候才开始同步,所以这里我们的设计是每次激活时,用symmetric自己的deploy/undeploy机制让其在启动时候自动跑replication任务。
820 0
+关注
中间件小哥
阿里中间件(Aliware)官方账号
1184
文章
52
问答
来源圈子
更多
阿里云中间件主要有包含这么几个: 分布式关系型数据库DRDS_水平拆分 做数据库扩展性的 、消息队列MQ 是做消息的中间件、企业级分布式应用服务EDAS 做分布式服务的、还有一些其他的中间件,比如配置服务、缓存等等。
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载