实战 | Telegraf+ InfluxDB+Grafana 搭建服务器性能监控平台

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 在之前的文章《移动端UI自动化过程中的难点及应对策略》中我们讨论了影响移动端自动化稳定性的一些因素,其中宿主机环境是一个不可忽视的问题,大家都知道移动端的自动化一般都需要将设备挂载到实体服务器上运行,如果服务器宿主机出现断网或者磁盘空间不足等情况,都会在一定程度上影响自动化任务的执行,因此今天跟大家分享一下如何做服务器宿主机的监控。

方案


这里我采用的是Telegraf+InfluxDB+Grafana方案:


  • Telegraf:是一个用Go 编写的代理程序,可收集系统和服务的统计数据,并写入到InfluxDB 数据库
  • InfluxDB:是一个用Go 编写的开源分布式时序、事件和指标数据库,无需外部依赖
  • Grafana:是一个开源的度量分析与可视化套件


下面默认环境以Mac系统为例讲解


InfluxDB的安装


使用homebrew安装启动:

brew update 
brew install influxdb ,
brew services start influxdb


Grafana的安装


使用homebrew装启动

brew update 
brew install grafana
brew services start grafana

访问:http://localhost:3000,就会跳转到登录页面,登录初始用户名admin,初始密码admin。


Telegraf的安装


使用homebrew装启动

brew update 
brew install telegraf 
brew services start telegraf


配置文件默认在这个路径下:

/usr/local/etc/telegraf.conf


修改配置文件将收集到的数据输出到InfluxDB:

# hostname相当于 agent 的名称 或 服务器的名称 
hostname = nginx_192.168.1.10
# 输出插件,假设我们将收集的数据输出到 InfluxDB
[[outputs.influxdb]]
    urls = ["http://192.168.1.1:8086"]
    database = "telegraf" # required
    retention_policy = "rp_day_30"
    write_consistency = "any"
    timeout = "5s"
    username = "telegraf"
    password = "xxxxxxxx"

Telegraf安装配置启动完后,我们开始配Grafana的数据源,如下


image.png

之前Telegraf启动后就已经开始向我们的InfluxDB上报数据了,这里数据源配置如下:


image.png

数据源创建成功后,我们就可以制作性能监控的Dashboard了,其实这里的Dashboard不需要我们手工一个一个的去配置,Grafana官方已经提供了很全面的模板资源如下:

https://grafana.com/grafana/dashboards?dataSource=influxdb&collector=Telegraf

image.png


通过筛选,我们可以找到很多符合条件的模板,这里我推荐一个模板ID:1443,导入:

image.png

image.png


最终效果如下:

image.png

相关实践学习
通过可观测可视化Grafana版进行数据可视化展示与分析
使用可观测可视化Grafana版进行数据可视化展示与分析。
相关文章
|
20天前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第26天】Prometheus与Grafana是智能运维中的强大组合,前者是开源的系统监控和警报工具,后者是数据可视化平台。Prometheus具备时间序列数据库、多维数据模型、PromQL查询语言等特性,而Grafana支持多数据源、丰富的可视化选项和告警功能。两者结合可实现实时监控、灵活告警和高度定制化的仪表板,广泛应用于服务器、应用和数据库的监控。
108 3
|
3月前
|
存储 监控 固态存储
【vSAN分布式存储服务器数据恢复】VMware vSphere vSAN 分布式存储虚拟化平台VMDK文件1KB问题数据恢复案例
在一例vSAN分布式存储故障中,因替换故障闪存盘后磁盘组失效,一台采用RAID0策略且未使用置备的虚拟机VMDK文件受损,仅余1KB大小。经分析发现,该VMDK文件与内部虚拟对象关联失效导致。恢复方案包括定位虚拟对象及组件的具体物理位置,解析分配空间,并手动重组RAID0结构以恢复数据。此案例强调了深入理解vSAN分布式存储机制的重要性,以及定制化数据恢复方案的有效性。
95 5
|
27天前
|
机器学习/深度学习 弹性计算 运维
云计算系列之阿里云ECS服务器管理实战
本文档介绍了阿里云ECS(Elastic Compute Service)的基本概念、实例管理、磁盘操作、快照与镜像功能及其应用场景,最后通过具体案例解析ECS的实际应用。ECS是阿里云提供的高效、可靠的云计算服务,支持多种业务需求,如Web应用、高并发网站、数据库等,帮助企业快速构建稳定安全的应用,提升运维效率,降低IT成本。文档还详细说明了ECS实例的创建方式、连接方法及日常管理操作,帮助用户更好地利用ECS服务。
60 2
云计算系列之阿里云ECS服务器管理实战
|
19天前
|
Prometheus 运维 监控
智能运维实战:Prometheus与Grafana的监控与告警体系
【10月更文挑战第27天】在智能运维中,Prometheus和Grafana的组合已成为监控和告警体系的事实标准。Prometheus负责数据收集和存储,支持灵活的查询语言PromQL;Grafana提供数据的可视化展示和告警功能。本文介绍如何配置Prometheus监控目标、Grafana数据源及告警规则,帮助运维团队实时监控系统状态,确保稳定性和可靠性。
95 0
|
2月前
|
Cloud Native Java 编译器
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
随着云计算技术的不断发展,云服务商们不断推出高性能、高可用的云服务器实例,以满足企业日益增长的计算需求。阿里云推出的倚天实例,凭借其基于ARM架构的倚天710处理器,提供了卓越的计算能力和能效比,特别适用于云原生、高性能计算等场景。然而,有的用户需要将传统基于x86平台的应用迁移到倚天实例上,本文将介绍如何将基于x86架构平台的应用迁移到阿里云倚天实例的服务器上,帮助开发者和企业用户顺利完成迁移工作,享受更高效、更经济的云服务。
将基于x86架构平台的应用迁移到阿里云倚天实例云服务器参考
|
2月前
|
网络协议
keepalived对后端服务器的监测方式实战案例
关于使用keepalived进行后端服务器TCP监测的实战案例,包括配置文件的编辑和keepalived服务的重启,以确保配置生效。
60 1
keepalived对后端服务器的监测方式实战案例
|
1月前
|
固态存储 开发者
阿里云服务器选购之国际版和国内版的平台对比及建议
阿里云服务器选购之国际版和国内版的平台对比及建议
|
3月前
|
SQL 缓存 自然语言处理
实战案例1:基于C语言的Web服务器实现。
实战案例1:基于C语言的Web服务器实现。
192 15
|
3月前
|
运维 数据安全/隐私保护 数据库管理
企业实战项目之服务器用户权限集中管理
企业实战项目之服务器用户权限集中管理
|
3月前
|
弹性计算 监控 网络安全
解锁云端力量:ECS全攻略,从新手到专家的实战之旅!轻松掌握云计算核心技能,驾驭数字浪潮之巅!
【8月更文挑战第22天】云计算中的弹性计算服务(ECS)让企业和开发者能按需获取虚拟服务器,灵活配置CPU、内存等资源。本文从零开始指导ECS的基础操作与高级技巧,包括实例创建、SSH连接、Web应用部署及利用ELB和自动伸缩优化性能。同时介绍监控工具和数据备份方法,帮助您全方位掌握ECS的高效运用,满足业务需求并保障数据安全。
68 3
下一篇
无影云桌面