Linux:系统性能监控工具-tsar安装和使用

简介: Linux:系统性能监控工具-tsar安装和使用

前言

做性能验证往往需要去监控系统的各项性能指标,Linux系统监控工具有很多,但对于命令行操作,安装便捷,监控项较全面等方面,个人比较推荐tsar

tsar

介绍

TSAR(Taobao System Activity Reporter))是淘宝自己开发的采集工具。

主要用来收集服务器的系统信息(如cpu,io,mem,tcp等),以及应用数据(如squid haproxy nginx等)。收集到的数据存储在磁盘上,可以随时查询历史信息,输出方式灵活多样,另外支持将数据存储到mysql中,也可以将数据发送到nagios报警服务器。Tsar在展示数据时,可以指定模块,并且可以对多条信息的数据进行merge输出,带–live参数可以输出秒级的实时信息。Tsar能够比较方便的增加模块,只需要按照tsar的要求编写数据的采集函数和展现函数,就可以把自定义的模块加入到Tsar中。

总体架构

Tsar是基于模块化设计的程序,程序有两部分组成:框架和模块。

  • 框架程序源代码主要在src目录,而模块源代码主要在modules目录中。
  • 框架提供对配置文件的解析,模块的加载,命令行参数的解析,应用模块的接口对模块原始数据的解析与输出。 模块提供接口给框架调用。

Tsar依赖与cron每分钟执行采集数据,因此它需要系统安装并启用crond,安装后,tsar每分钟会执行tsar --cron来定时采集信息,并且记录到原始日志文件。

安装tasr

有两种安装方式

  1. clone代码
git clone git://github.com/alibaba/tsar.git
cd tsar
make
make install
  1. 下载源码-我是采用的这个方法
#依次执行以下命令即可
1.wget -O tsar.zip https://github.com/alibaba/tsar/archive/master.zip --no-check-certificate
2.unzip tsar.zip
3.cd tsar-master
4.make
5.make install

执行命令

wget -O tsar.zip https://github.com/alibaba/tsar/archive/master.zip --no-check-certificate

d2c78a3268374c5c98b49ea55b033012.png


解压:unzip tsar.zip


3a69141073bb4bfb9516537c499cb846.png


执行命令:

cd tsar-master

make


362157653ed248429a6ba4587234d0e5.png

执行命令:make install

7d933b463cd74ab79a0ac59591abffb2.png


tsar配置介绍

安装完tsar后会生成如下的文件


Tsar配置文件路径:/etc/tsar/tsar.conf,tsar的采集模块和输出的具体配置;

定时任务配置:/etc/cron.d/tsar,负责每分钟调用tsar执行采集任务;

日志文件轮转配置:/etc/logrotate.d/tsar,每个月会把tsar的本地存储进行轮转;

模块路径:/usr/local/tsar/modules,各个模块的动态库so文件;


配置文件

负责tsar的采集模块和输出的具体配置;在这里配置启用哪些模块,输出等内容。

cd /etc/tsar/tsar.conf



937403dd0cf34f79953d46893392355c.png

常用参数说明

可结合下文参数,来对应查看/etc/tsar/tsar.conf文件

debug_level 指定tsar的运行级别,主要用来调试使用

mod_xxx on/off 开启指定模块

out_interface 设置输出类型,支持file,nagios,db

out_stdio_mod 设置用户终端默认显示的模块

output_db_mod设置哪些模块输出到数据库

output_db_addr 数据库的ip和端口

output_nagios_mod设置哪些模块输出到nagios

include 支持include配置,主要用来加载用户的自定义模块

cycle_time指定上报的间隔时间,由于tsar每一分钟采集一次,上报时会判断是否符合时间间隔,如设置300的话,则在0,5等整点分钟会上报nagios

threshold 设置某个要报警项的阀值,前面是模块和要监控的具体名称,后面的四个数据代表报警的范围,warn和critical的范围

定时任务配置

每分钟以root用户的角色调用tsar命令来执行数据采集。

cat  /etc/cron.d/tsar


1939b408028a4d66ad5a2f0afb41d2f7.png


日志文件

每个月会把tsar的本地存储进行轮转,此外这里也设定了数据在/var/log/tsar.data下

cd /etc/logrotate.d/tsar

6fc2490332f444cc999ca963d052abb2.png


tsar使用

在Tsar的使用中,如下是可以参考的帮助信息,但实际使用可可能不会涉及如此多,可以直接参考下一个实际使用

b04309ad0f114d7db702e81be44a4cff.png

Usage: tsar [options]
Options:
    -check         查看最后一次的采集数据
    --check/-C     查看最后一次tsar的提醒信息,如:tsar --check / tsar --check --cpu --io
    --watch/-w     显示最后多少分钟的记录. 如:tsar --watch 30 / tsar --watch 30 --cpu --io
    --cron/-c      使用crond模式来进行tsar监控
    --interval/-i  指明tsar的间隔时间,默认单位分钟,默认显示间隔5分钟;带上--live参数则单位是秒,默认是5秒。 
    --list/-L      列出启用的模块
    --live/-l      启用实时模式,类似iostat等,可以配合-i参数和模块参数使用。
    --file/-f      指定输入文件
    --ndays/-n     控制显示多长时间的历史数据,默认1天
    --date/-d      指定日期,YYYYMMDD或者n代表n天前
    --merge/-m     对有多个数据的展示,进行汇总,如机器上跑了3个squid,可以用 tsar –squid -m的放式进行展示汇总。
    --detail/-D    能够指定查看主要字段还是模块的所有字段
    --spec/-s      指定字段,tsar –cpu -s sys,util
    --item/-I      显示指定项目数据, 如:tsar --io -I sda
    -–help/-h      显示提示信息和模块信息
Modules Enabled:
    --cpu          列出cpu相关的监控计数
    --mem          物理内存的使用情况
    --swap         虚拟内存的使用情况
    --tcp          TCP协议IPV4的使用情况
    --udp          UDP协议IPV4的使用情况
    --traffic      网络传出的使用情况
    --io           Linux IO的情况
    --pcsw         进程和上下文切换
    --partition    磁盘使用情况
    --tcpx         TCP连接相关的数据参数
    --load         系统负载情况

tsar实际使用参考

查看可用的监控模块列表

tsar -L

可在配置文件中调整:/etc/tsar/tsar.conf

4a882b66a5824e1f96ed8a5a6d5073d8.png

查看CPU情况

tsar --cpu

user表示用户空间cpu使用情况

sys表示内核空间cpu使用情况

wait表示IO对应的cpu使用情况

hirq,sirq分别是硬件中断,软件中断的使用情况

util是系统使用cpu的总计情况


b6626809b1594c4ab8295f03e2522708.png


依次类推:

可针对的查看下面具体某项或某几项的情况

cpu
mem
swap
tcp
udp
traffic
io
pcsw
partition
tcpx
load

tsar常用命令

显示1天内的历史汇总(summury)信息,以默认5分钟为间隔

tsar

查看所有监控项实时数据

tsar -l   

查看所有监控项,历史或实时数据,以每次1秒钟作为采集显示

tsar -d 1 --cpu --load --mem -i 1
#-d 1: 查看一天前的数据;去掉-d 1则表示查询截止目前24小时内的数据
#-i 1 : 表示以每次1分钟作为采集显示;

查看所有监控项历史或实时数据,以每次1秒钟作为采集显示

tsar -i 1 -l
#-l: 实时数据;不加-l就是所有历史数据了

查出指定监控项实时数据,以每次1秒钟作为采集显示

tsar --cpu --load --mem -i 1 -l

查出指定监控项实时数据,以每次5秒钟作为采集显示

tsar --cpu --load --mem -l 5

追溯历史日期的数据

tsar --load --cpu -d "20230111" -f /var/log/tsar.data
tsar --load --cpu -d "20230111"
#-d : 指定历史日期;
#-f : 指定tsar的数据文件;
目录
相关文章
|
1天前
|
存储 Prometheus 监控
Linux技术工具:bpftrace介绍
Linux技术工具:bpftrace介绍
12 7
|
2天前
|
关系型数据库 MySQL Linux
Linux系统中Mysql5.7建立远程连接
Linux系统中Mysql5.7建立远程连接
4 0
|
3天前
|
监控 算法 Linux
探索Linux中的lz4命令:高效的数据压缩工具
**探索Linux中的LZ4工具:快速数据压缩。LZ4算法提供高速压缩与解压缩,适合实时数据处理。命令行工具如`lz4c`用于文件压缩(`lz4c file.txt compressed.lz4`)和解压缩(`lz4c -d compressed.lz4 decompressed.txt`)。特点是速度快、低内存占用,可选压缩级别。注意命令的实际形式取决于安装的实现,使用前应查阅文档。**
|
3天前
|
监控 Linux 数据处理
探索Linux中的`lsmem`命令:深入了解系统内存布局
`lsmem`是Linux命令,用于显示系统内存布局和大小,帮助管理员和开发者理解内存使用情况。它提供详细输出,包括内存块的大小、范围、类型和关联,支持多种格式展示,如树状图。命令参数如`-h`显示帮助,`-t`以树形展示,`--human-readable`使大小更易读。需root权限运行,常与`free`、`vmstat`等工具结合使用,用于监控和优化内存。注意不同发行版可能存在兼容性差异。
|
3天前
|
监控 Linux 数据处理
lslocks:Linux系统中的锁信息查看利器
`lslocks`是Linux工具,用于查看系统上的文件锁信息,帮助诊断进程同步问题。它显示持有锁的进程、锁类型(如POSIX、flock)和状态。通过简洁的输出,用户能识别死锁和资源争用,优化性能。结合其他命令如`grep`和`awk`可增强分析能力。需适当权限运行,定期监控以预防并发访问问题,处理死锁时要谨慎。
|
4天前
|
Prometheus 监控 Cloud Native
搭建服务端性能监控系统 Prometheus 详细指南
搭建Prometheus监控系统,涉及Ubuntu上Docker的安装,通过`docker run`命令启动Prometheus容器,并挂载配置文件。配置文件默认示例可以从GitHub获取,调整`scrape_interval`和`targets`以监控Prometheus自身及Node Exporter(提供系统指标)。Node Exporter以Docker容器形式运行在9100端口。完成配置后,重启Prometheus容器,通过Web界面查看监控数据。后续将介绍结合Grafana进行可视化。
7 0
|
4天前
|
存储 安全 Linux
一行代码使Linux系统崩溃?
一行代码使Linux系统崩溃?
13 1
|
4天前
|
网络协议 Linux Shell
【权限提升】Linux系统&Docker挂载&Rsync未授权&Sudo-CVE&Polkit-CVE
【权限提升】Linux系统&Docker挂载&Rsync未授权&Sudo-CVE&Polkit-CVE
|
4天前
|
关系型数据库 MySQL Shell
【权限提升】Linux系统&环境变量&定时任务&权限配置不当&MDUT自动化
【权限提升】Linux系统&环境变量&定时任务&权限配置不当&MDUT自动化
|
1月前
|
SQL 监控 架构师
linux系统性能分析的目的
【4月更文挑战第19天】在Linux系统中,找到性能瓶颈是关键,涉及应用程序、操作系统、硬件和网络的全面排查。优化方案通常针对应用程序和操作系统,而硬件和网络问题较易定位。目标是平衡资源使用,确保系统响应和稳定性。系统管理员、架构设计人员和开发人员共同参与,通过监控硬件、网络、配置和代码来优化性能。流程包括管理员初步判断,架构师处理结构问题,开发人员优化代码,实现系统资源的均衡利用。
27 1