性能监控之国产时序库TDengine TDinsight dashboard 指标解析

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
简介: 【2月更文挑战第1天】性能监控之国产时序库TDengine TDinsight dashboard 指标解析

一、前言

TDengine 是一款专为物联网、工业互联网等场景时序数据库,目前为国产化(信创)项目中的主流方案。

image.png

本文主要总结解析 TaosKeeper Prometheus Dashboard for 3.x dashboard ,让大家对 TDengine 主流监控指标有个整体了解,方便平常在性能监控工作查阅。

二、主要逻辑单元说明

TDengine 分布式架构的逻辑结构图如下:

image.png

一个完整的 TDengine 系统是运行在一到多个物理节点上的,逻辑上,它包含数据节点(dnode)、TDengine 应用驱动(taosc)以及应用(app)。系统中存在一到多个数据节点,这些数据节点组成一个集群(cluster)。应用通过 taosc 的 API 与 TDengine 集群进行互动。下面对主要逻辑单元进行简要介绍。

  • 数据节点(dnode): dnode 是 TDengine 服务器侧执行代码 taosd 在物理节点上的一个运行实例,一个工作的系统必须有至少一个数据节点。dnode 包含零到多个逻辑的虚拟节点(vnode),零或者至多一个逻辑的管理节点(mnode),零或者至多一个逻辑的弹性计算节点(qnode),零或者至多一个逻辑的流计算节点(snode)。
  • 虚拟节点(vnode): 为更好的支持数据分片、负载均衡,防止数据过热或倾斜,数据节点被虚拟化成多个虚拟节点(vnode,图中 V2,V3,V4 等)。每个 vnode 都是一个相对独立的工作单元,是时序数据存储的基本单元,具有独立的运行线程、内存空间与持久化存储的路径。一个 vnode 包含一定数量的表(数据采集点)
  • 管理节点(mnode): 一个虚拟的逻辑单元,负责所有数据节点运行状态的监控和维护,以及节点之间的负载均衡(图中 M)。同时,管理节点也负责元数据(包括用户、数据库、超级表等)的存储和管理,因此也称为 Meta Node。TDengine 集群中可配置多个(最多不超过 3 个)mnode,它们自动构建成为一个虚拟管理节点组(图中 M1,M2,M3)。
  • 虚拟节点组(VGroup): 不同数据节点上的 vnode 可以组成一个虚拟节点组(vgroup),采用 RAFT 一致性协议,保证系统的高可用与高可靠。

三、集成监控

TDengine 通过 taosKeeper 将服务器的 CPU、内存、硬盘空间、带宽、请求数、磁盘读写速度等信息定时写入指定数据库。TDengine 还将重要的系统操作(比如登录、创建、删除数据库等)日志以及各种错误报警信息进行记录。系统管理员可以从 CLI 直接查看这个数据库,也可以在 WEB 通过图形化界面查看这些监测信息。

具体可以参考官网的资料,我就不再此赘述了。

四、监控数据库

TDinsight dashboard 数据来源于 log 库(存放监控数据的默认db,可以在 taoskeeper 配置文件中修改。taoskeeper 启动后会自动创建 log 库,并将监控数据写入到该数据库中。

相关表说明:

  • cluster_info 表记录集群信息。
  • d_info 表记录 dnode 状态信息。
  • m_info 表记录 mnode 角色信息。
  • dnodes_info 记录 dnode 信息。
  • data_dir 表记录 data 目录信息。
  • log_dir 表记录 log 目录信息。
  • temp_dir 表记录 temp 目录信息。
  • vgroups_info 表记录虚拟节点组信息。
  • vnodes_role 表记录虚拟节点角色信息。
  • log_summary 记录日志统计信息。
  • grants_info 记录授权信息。
  • keeper_monitor 记录 taoskeeper 监控数据。
  • taosadapter_restful_http_request_total 记录 taosadapter rest 请求信息,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
  • taosadapter_restful_http_request_fail 记录 taosadapter rest 请求失败信息,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
  • taosadapter_restful_http_request_in_flight 记录 taosadapter rest 实时请求信息,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
  • taosadapter_restful_http_request_summary_milliseconds 记录 taosadapter rest 请求汇总信息,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
  • taosadapter_system_mem_percent 表记录 taosadapter 内存使用情况,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。
  • taosadapter_system_cpu_percent 表记录 taosadapter cpu 使用情况,该表为 schemaless 方式创建的表,时间戳字段名为 _ts。

五、Dashboard 看板

taosdata 提供了 TaosKeeper Prometheus Dashboard for 3.x dashboard,dashboard ID 18587

(一)集群状态(Cluster Status)

1、整体视角

image.png

这部分包括集群当前信息和状态,告警信息也在此处(从左到右,从上到下)。

2、分项说明

image.png

  • First EP:当前TDengine集群中的firstEp设置。
  • Version:TDengine 服务器版本(master mnode)。
  • Master Uptime: 当前Master MNode 被选举为 Master 后经过的时间。
  • Expire Time - 企业版过期时间。

image.png

指标说明:

  • Used Measuring Points - 企业版已使用的测点数。
  • Databases - 数据库个数。
  • Tables - 当前表个数。
  • Connections - 当前连接个数。

image.png
image.png

指标说明:

  • DNodes/MNodes/VGroups/VNodes:每种资源的总数和存活数。

image.png
image.png

指标说明:

  • DNodes/MNodes/VGroups/VNodes Alive Percent:每种资源的存活数/总数的比例,启用告警规则,并在资源存活率(1分钟内平均健康资源比例)不足100%时触发。

image.png

指标说明:

  • Measuring Points Used:启用告警规则的测点数用量(社区版无数据,默认情况下是健康的)。
  • Grants Expire Time:启用告警规则的企业版过期时间(社区版无数据,默认情况是健康的)

image.png

指标说明:

  • Error Rate:启用警报的集群总合错误率(每秒平均错误数)。

(二)DNodes 概述(DNodes Overview)

image.png

指标说明:

  • DNodes Status:show dnodes 的简单表格视图。
  • DNodes Lifetime:从创建 dnode 开始经过的时间。
  • DNodes Number:DNodes 数量变化。
  • MNodes Number:MNodes 数量变化。

    (三)请求(Requests)

1、整体视角

image.png

2、分项说明

image.png

指标说明:

  • Requests (Inserts):累计插入次数。

image.png

指标说明:

  • Requests Rate(Inserts per Second):平均每秒插入次数。

image.png

指标说明:

  • Requests (Selects):查询请求数及变化率(count of second)。

(四)DNode 资源使用情况(DNode Usage)

1、整体视角

image.png

2、分项说明

image.png

指标说明:

  • Uptime:从创建 dnode 开始经过的时间。
  • Has MNodes?:当前 dnode 是否为 mnode。
  • CPU Cores:CPU 核数。
  • VNodes Number:当前dnode的VNodes数量。
  • VNodes Masters:处于master角色的vnode数量。
    image.png

指标说明:

  • Current CPU Usage of taosd:taosd进程的CPU使用率。
  • Current Memory Usage of taosd:taosd进程的内存使用情况。
  • Disk Used:taosd数据目录的总磁盘使用百分比。
    image.png

指标说明:

  • CPU Usage:进程和系统 CPU 使用率。
  • RAM Usage:RAM 使用指标时间序列视图。

image.png

指标说明:

  • Disk Used:多级存储下每个级别使用的磁盘(默认为 level0 级)。
  • Disk Increasing Rate per Minute:每分钟磁盘用量增加或减少的百分比。
    image.png

指标说明:

  • Disk IO:磁盘IO速率。
  • Net IO:网络IO,除本机网络之外的总合网络IO速率。

参考资料:

目录
相关文章
|
24天前
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
122 9
|
10天前
|
存储 数据库 对象存储
新版本发布:查询更快,兼容更强,TDengine 3.3.4.3 功能解析
经过 TDengine 研发团队的精心打磨,TDengine 3.3.4.3 版本正式发布。作为时序数据库领域的领先产品,TDengine 一直致力于为用户提供高效、稳定、易用的解决方案。本次版本更新延续了一贯的高标准,为用户带来了多项实用的新特性,并对系统性能进行了深度优化。
20 3
|
2月前
|
数据采集 JavaScript API
网页解析库:BeautifulSoup与Cheerio的选择
网页解析库:BeautifulSoup与Cheerio的选择
|
2月前
|
存储 Go PHP
Go语言中的加解密利器:go-crypto库全解析
在软件开发中,数据安全和隐私保护至关重要。`go-crypto` 是一个专为 Golang 设计的加密解密工具库,支持 AES 和 RSA 等加密算法,帮助开发者轻松实现数据的加密和解密,保障数据传输和存储的安全性。本文将详细介绍 `go-crypto` 的安装、特性及应用实例。
117 0
|
3月前
|
存储 SQL 数据挖掘
TDengine 流计算与窗口机制的深度解析:揭示计数窗口的关键作用
在 TDengine 3.2.3.0 版本中,我们针对流式计算新增了计数窗口,进一步优化了流式数据处理的能力。本文将为大家解读流式计算与几大窗口的关系,并针对新增的计数窗口进行详细的介绍,帮助大家进一步了解 TDengine 流式计算,以便更好地进行应用。
70 1
|
4月前
|
存储 弹性计算 缓存
阿里云服务器ECS通用型实例规格族特点、适用场景、指标数据解析
阿里云服务器ECS提供了多种通用型实例规格族,每种规格族都针对不同的计算需求、存储性能、网络吞吐量和安全特性进行了优化。以下是对存储增强通用型实例规格族g8ise、通用型实例规格族g8a、通用型实例规格族g8y、存储增强通用型实例规格族g7se、通用型实例规格族g7等所有通用型实例规格族的详细解析,包括它们的核心特点、适用场景、实例规格及具体指标数据,以供参考。
阿里云服务器ECS通用型实例规格族特点、适用场景、指标数据解析
|
3月前
|
SQL Oracle 关系型数据库
SQL整库导出语录:全面解析与高效执行策略
在数据库管理和维护过程中,整库导出是一项常见的需求,无论是为了备份、迁移还是数据分析,掌握如何高效、准确地导出整个数据库至关重要
|
3月前
|
前端开发 JavaScript
pyquery:一个灵活方便的 HTML 解析库
pyquery:一个灵活方便的 HTML 解析库
33 1
|
4月前
|
XML JSON 网络协议
超级好用的C++实用库之字节流解析器
超级好用的C++实用库之字节流解析器
50 3
|
4月前
|
数据采集 存储 JSON
从零到一构建网络爬虫帝国:HTTP协议+Python requests库深度解析
在网络数据的海洋中,网络爬虫遵循HTTP协议,穿梭于互联网各处,收集宝贵信息。本文将从零开始,使用Python的requests库,深入解析HTTP协议,助你构建自己的网络爬虫帝国。首先介绍HTTP协议基础,包括请求与响应结构;然后详细介绍requests库的安装与使用,演示如何发送GET和POST请求并处理响应;最后概述爬虫构建流程及挑战,帮助你逐步掌握核心技术,畅游数据海洋。
86 3

推荐镜像

更多