系统监控工具 Tsar

简介:

Tsar是淘宝的一个用来收集服务器系统和应用信息的采集报告工具,如收集服务器的系统信息(cpu,mem等),以及应用数据(nginx、swift等),收集到的数据存储在服务器磁盘上,可以随时查询历史信息,也可以将数据发送到nagios报警。

Tsar能够比较方便地增加模块,只需要按照 tsar 的要求编写数据的采集函数和展现函数,就可以把自定义的模块加入到tsar中。

安装

Tsar目前托管在GitHub上,下载编译安装步骤:

[azureuser@mono tsar-master]$sudo wget -O tsar.zip https://github.com/alibaba/tsar/archive/master.zip --no-check-certificate

[azureuser@mono tsar-master]$ sudo unzip tsar.zip

[azureuser@mono tsar-master]$ cd tsar

[azureuser@mono tsar-master]$ sudo make

[azureuser@mono tsar-master]# sudo make install

定时任务配置:/etc/cron.d/tsar,负责每分钟调用tsar执行采集任务;
日志文件轮转配置:/etc/logrotate.d/tsar,每个月会把tsar的本地存储进行轮转;
Tsar配置文件路径:/etc/tsar/tsar.conf,tsar的采集模块和输出的具体配置;
模块路径:/usr/local/tsar/modules,各个模块的动态库so文件;
Tsar配置

Tsar刚安装完,还没有历史数据,想要check是否正常,执行tsar -l,查看是否有实时信息输出:

[azureuser@mono tsar-master]$ tsar -l 
Time              ---cpu-- ---mem-- ---tcp-- -----traffic---- --sda--- --sdb---  ---load- 
Time                util     util   retran    pktin  pktout     util     util     load1 
17/08/13-02:52:11   0.20    19.78     0.00     0.00    0.00     0.40     0.00      0.00

Tsar的配置主要都在/etc/tsar/tsar.conf中,常用的有:

增加一个模块,添加 mod_ on 到配置文件中
打开或者关闭一个模块,修改mod_ on/off
output_stdio_mod 能够配置执行tsar时的输出模块
output_file_path 采集到的数据默认保存到的文件(如果修改的话需要对应修改轮转的配置/etc/logrotate.d/tsar)
output_interface 指定tsar的数据输出目的,默认file保存本地,nagios/db输出到监控中心/数据库中,这两个功能还需要结合其它配置
Tsar使用

查看历史数据,tsar
-l/–list 查看可用的模块列表
-l/–live 查看实时数据,tsar -l –cpu
-i/–interval 指定间隔,历史,tsar -i 1 –cpu
–modname 指定模块,tsar –cpu
-s/–spec 指定字段,tsar –cpu -s sys,util
-d/–date 指定日期,YYYYMMDD或者n代表n天前
-C/–check 查看最后一次的采集数据
-d/–detail 能够指定查看主要字段还是模块的所有字段
-h/–help 帮助功能
高级功能

输出到nagios
配置: 首先配置output_interface file,nagios,增加nagios输出

然后配置nagios服务器和端口,以及发送的间隔时间

The IP address or the host running the NSCA daemon

server_addr nagios.server.com

The port on which the daemon is running - default is 5667

server_port 8086

The cycle of send alert to nagios

cycle_time 300

由于是nagios的被动监控模式,需要制定nsca的位置和配置文件位置

nsca client program

send_nsca_cmd /usr/bin/send_nsca

send_nsca_conf /home/a/conf/amon/send_nsca.conf

接下来制定哪些模块和字段需要进行监控,一共四个阀值对应nagios中的不同报警级别

tsar mod alert config file

threshold [hostname.]servicename.key;w-min;w-max;c-min;cmax;

threshold cpu.util;50;60;70;80;

输出到mysql
配置: 首先配置output_interface file,db,增加db输出

然后配置哪些模块数据需要输出

output_db_mod mod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udpmod_io

然后配置sql语句发送的目的地址和端口

output_db_addr console2:56677

目的地址在该端口监听tcp数据,并且把数据入库即可,可以参照tsar2db:https://github.com/kongjian/tsar2db

本文来自云栖社区合作伙伴“doNET跨平台”,了解相关信息可以关注“opendotnet”微信公众号

目录
相关文章
|
5月前
|
安全 Windows
硬盘数据恢复—硬盘坏道的分类以及不同类型硬盘坏道的修复方法
坏道是硬盘最常见的原因之一。导致硬盘坏道的原因很多,除了正常老化,还有其他一些原因。使用过程中频繁整理碎片、不适当的超频、供电质量不好、温度过高、灰尘、震动等都会导致硬盘出现坏道。
pip 更换源 国内源 阿里源
pip 更换源 国内源 阿里源
4938 0
|
监控 前端开发 数据库连接
Zabbix 5.0 LTS的web界面安装及修改zabbix web管理员的默认密码
这篇文章是关于如何安装Zabbix 5.0 LTS的web界面以及如何修改Zabbix web管理员默认密码的教程。
1163 1
|
负载均衡 应用服务中间件 Linux
在Linux中,Nginx如何实现负载均衡分发策略?
在Linux中,Nginx如何实现负载均衡分发策略?
|
Java API Maven
告别漫长重启时代:Quarkus热部署功能让你的代码改动瞬间生效,提升开发效率的秘密武器揭秘!
Quarkus是一款备受开发者青睐的开源框架,以其轻量级、高性能及出色的云适应性著称。其内置的热部署功能让开发者能在不重启应用的情况下实时预览代码修改效果,显著提升开发效率。本文将深入解析Quarkus热部署的工作原理,并通过示例演示如何启用和使用该功能。首先确保已安装Java 11及以上版本和Maven,然后按照指引创建并运行一个Quarkus项目。通过修改RESTful API端点的返回值,我们可以直观地看到热部署带来的即时效果,从而体验到这一功能为开发流程带来的巨大便利。这对于追求高效开发的技术团队而言,无疑是强大的助力。
371 1
|
编解码 前端开发 JavaScript
web端 本地调用摄像头、前端摄像头
web端 本地调用摄像头、前端摄像头
|
传感器 数据采集 监控
基于STM32的温室大棚环境检测及自动浇灌系统设计
基于STM32的温室大棚环境检测及自动浇灌系统设计
3568 0
|
运维 监控 Python
自动化运维:使用Python脚本实现系统监控
【8月更文挑战第31天】 在现代IT运维管理中,自动化已成为提高效率和准确性的关键。本文将通过一个Python脚本示例,展示如何实现对服务器的自动监控,包括CPU使用率、内存占用以及磁盘空间的实时监测。这不仅帮助运维人员快速定位问题,也减轻了日常监控工作的负担。文章以通俗易懂的语言,逐步引导读者理解并实践自动化监控的设置过程。
|
存储 网络协议 算法
|
移动开发 前端开发 JavaScript
【前端动画】实现动画的6种方式
【前端动画】实现动画的6种方式
1926 0