淘宝开源其系统监控工具Tsar

简介:

Tsar 简介

   TsarTaobao System Activity Reporter是淘宝开发的一个非常好用的系统监控工具,在淘宝内部大量使用,它不仅可以监控CPUIO、内存、TCP等系统状态,也可以监控ApacheNginx/TengineSquid等服务器状态。值得一提的是,Tsar 支持将数据存储到 MySQL 中,也可以将数据发送到 Nagios 报警服务器。

   Tsar可将收集到的数据存储在磁盘上,另外可以支持将数据存储到MySQL中,也可将数据发送到Nagios报警服务器。在展示数据层面,可以指定模块,并且支持对多条信息的数据进行Merge输出,如果带--live参数,还可以输出秒级的实时信息。

一、Tsar 架构介绍     

从架构上来看,Tsar基于模块化设计,源代码上来看主要包含两部分:框架和模块。框架源代码主要存放在src目录,模块源代码主要在modules目录中。框架提供对配置文件的解析、模块的加载、命令行参数的解析、应用模块的接口对模块原始数据的解析与输出。

1.1 按功能划分


221332363.png

1.2 采集流程

221449552.png

1.3 展现流程

221606406.png

二、Tsar 特点:

1. 技术开源

2. 模块化

3. 自带很多系统性能监控模块

4. 自带很多常用软件的监控模块

5. 可自写插件收集监控其他信息

6. 支持本机查看

7. 支持输出到远程数据库

8. 配合nagios的被动监控,页面显示

三、Tsar 部署

Tsar 提供了两种安装方法,

3.1 github安装

$ git clone git://github.com/kongjian/tsar.git

$ cd tsar

$ make

# make install

3.2 下载zip文件安装

$ wget -O tsar.zip https://github.com/alibaba/tsar/archive/master.zip --no-check-certificate

$ unzip tsar.zip

$ cd tsar

$ make

# make install

参考地址:https://github.com/alibaba/tsar

四、Tsar 目录结构

4.1 定时任务,负责每分钟调用tsar执行采集任务;

/etc/cron.d/tsar

4.2 日志文件轮转配置,每个月会把tsar的本地存储进行轮转;

/etc/logrotate.d/tsar

4.3 Tsar配置文件路径,tsar的采集模块和输出的具体配置;

/etc/tsar/tsar.conf

4.4 模块路径,各个模块的动态库so文件;

/usr/local/tsar/modules

4.5 二进制程序,tsar执行程序

/usr/bin/tsar

五、Tsar使用

5.1  基本模块

系统:cpu/mem/load/tcp/traffic/io/disk等;

应用:nginx/trafficserver/lvs/haproxy

参考链接:https://github.com/alibaba/tsar/tree/master/modules

5.2 指定属性查看数据

字段 参数 示例
指定模块 --list/l tsar --mem  -l -i 1
指定实时数据   --live/-l tsar -l --cpu
指定间隔时间 --interval/-i tsar -i 1 --cpu
指定模块 --modname tsar --cpu
指定字段 --spec/-s tsar --cpu -s sys,wait
指定日期 --date/-d tsar --cpu -s sys,wait -d n
查看最后一次采集 --check/-C tsar --cehck --cpu -s sys
指定查看字段还是模块 --detail/-d tsar -d cpu
帮助功能 --help/-h tsar -h

如图所示:

221915199.png

5.3 实时信息查看

Live 模式,实时查看数据,可指定模块,可指定间隔时间

222048962.png

5.4 历史信息查看

指定模块,间隔分钟,查看N天数据

222138935.png

5.5 查看多item模块

比如多块磁盘信息(因为本人是虚拟机,所以只能看到一块磁盘信息)

224413457.png


5.6 查看最近一次数据信息

--check,输出最近一分钟数据,用于监控

222421355.png



本文转自 kuangling 51CTO博客,原文链接:http://blog.51cto.com/kling/1341330

相关文章
|
运维 安全 Cloud Native
Apsara Stack 技术百科 | 混合云全景智能化观测平台Sunfire
在企业数字化转型的浪潮中,核心业务的上云和迁云无疑是转型过程的重中之重,企业对于数字安全性及等保合规层面的需求也日益强烈,混合云成为诸多大型政府企业客户上云迁云的首选方案。随着企业云上业务的复杂化,云上云下技术栈的多样化,以及云上运维组织规模的扩大化,云上业务的稳定性和连续性面临着巨大的挑战。
4429 0
Apsara Stack 技术百科 | 混合云全景智能化观测平台Sunfire
|
JavaScript
Qt视频播放器[QMediaPlayer+QVideowidget]
本代码在Window10下运行,利用qMediaPlayer和qvideowidget实现视频文件mp4的播放,并且提供进度显示,还可以通过拖动进度条来变换播放位置
1778 0
|
Ubuntu
Ubuntu 20.04 安装 Fira Code 字体
Ubuntu 20.04 安装 Fira Code 字体
1711 0
|
5月前
|
运维 负载均衡 JavaScript
Nginx负载均衡故障转移(手把手教你搭建高可用Web服务)
本教程详解Nginx负载均衡与故障转移配置,通过upstream模块实现高可用反向代理。即使后端服务器宕机,Nginx也能自动切换流量,保障服务连续性,适合运维新手快速上手。
|
运维 Kubernetes 监控
什么是Kubeasz
Kubeasz(Kubernetes Easy Setup with Ansible)是一个开源项目,旨在简化Kubernetes集群的部署过程。它使用Ansible作为基础设施管理工具,通过预定义的剧本和配置模板,自动化整个K8s集群的搭建流程。以下是对Kubeasz的详细介绍: ### 一、Kubeasz的特点 1. **快速部署**:Kubeasz支持一键部署Kubernetes集群,大大节省了运维成本和时间。 2. **高可用性**:可以部署高可用的Kubernetes集群,确保系统的稳定性和可靠性。 3. **可扩展性**:支持容器化部署,可以方便地扩展集群规模,满足不同的业务需
2200 3
|
存储 搜索推荐 大数据
数据大爆炸:解析大数据的起源及其对未来的启示
数据大爆炸:解析大数据的起源及其对未来的启示
898 15
数据大爆炸:解析大数据的起源及其对未来的启示
|
人工智能 数据可视化 机器人
【通义灵码】三句话生成P5.js粒子特效代码,人人都可以做交互式数字艺术
我发掘出的通义灵码AI程序员新玩法:三句话生成P5.js粒子特效代码,人人都可以做交互式数字艺术
600 6
|
IDE 开发工具
鸿蒙Flutter实战:11-使用 Flutter SDK 3.22.0
本文介绍了如何使用 Flutter SDK 3.22.0 搭建鸿蒙开发环境。首先安装 Flutter SDK 3.22.0,并通过 FVM 管理多个版本。接着配置项目,使用 `fvm use custom_3.22.0` 设置自定义 SDK 版本。添加鸿蒙平台支持并进行项目签名,最后通过 `fvm flutter run` 运行项目。详细步骤包括安装、项目配置、签名和运行,确保开发环境顺利搭建。
974 7
鸿蒙Flutter实战:11-使用 Flutter SDK 3.22.0
|
弹性计算 负载均衡 算法
slb 配置不当
【11月更文挑战第2天】
547 10