Prometheus监控平台配置--监控集群资源信息

本文涉及的产品
可观测监控 Prometheus 版,每月50GB免费额度
简介: 在scrape_configs 配置项下添加Linux 监控的job,其中 IP 修改为上面部署node_exporter机器的ip,端口号为9100,需要注意缩进。

之前我们介绍的都是对单机的监控,今天介绍下用Prometheus对集群多台机器的系统资源进行监控。
我们需要在被压测服务器上安装 node_exporter和mysql_exporter,通过这两个工具对操作系统和mysql进行监控,将收集的数据存储到Prometheus,Prometheus其实有点像个数据库,然后通过Grafana从Prometheus中读取数据进行展示。

1.环境准备
1.1.环境准备
关闭所有Linux机器的防火墙:

systemctl stop firewalld.service
保证所有Linux机器的时间是准确的,执行date命令检查;如果不准确,可以使用 ntp 同步最新网络时间,命令如下:

yum install -y ntp
ntpdate pool.ntp.org
1.2.运行环境
运行环境为:CentOS7.5 64位操作系统.

2.node_exporter安装
2.1.下载&上传
node_exporter需要安装在被压测服务器上,首先我们需要下载node_exporter,网盘链接如下:https://pan.baidu.com/s/1t81wou7zmNA44V3A5POxDQ,提取码:s91f。

    下载成功后通过rz命令上传到任意目录,我还是上传到之前的home/tools目录,如下图所示。

2.2.启动
上传成功后执行命令将压缩包解压,然后对文件进行重命名:

    解压命令:

tar xvf node_exporter-0.18.1.linux-amd64.tar.gz
重命名:

mv node_exporter-0.18.1.linux-amd64 node_exporter
进入到解压后的文件夹中,执行启动脚本命令如下:

进入node_exporter目录

cd ./node_exporter

启动node_exporter

nohup ./node_exporter &
2.3.检查是否启动成功
启动之后执行命令查看当前目录下nohup文件日志,如果出现下述日志代表启动成功,如下图所示:

tail -100 nohup.out
3.部署prometheus
3.1.下载&上传
部署prometheus的时候最好将prometheus系统安装在其它服务器上,如果没有资源也可以将prometheus和node_exporter放到同一台服务器。

    通过网盘链接下载prometheus,然后通过rz命令将压缩文件上传到home/tools目录下。网盘链接:https://pan.baidu.com/s/1U4lXhWxJDxRnvsKtd7Pj8g,提取码:471s。

3.2.配置&启动
上传成功后执行命令将压缩包解压,然后对文件进行重命名:

    解压命令:

tar xvf prometheus-2.15.2.linux-amd64.tar.gz
重命名:

mv prometheus-2.15.2.linux-amd64 prometheus-2.15.2
进入到解压后的文件夹中,修改配置文件,添加要监控的服务器信息,因为我的是本机所以是localhost。

vi prometheus.yml
在scrape_configs 配置项下添加Linux 监控的job,其中 IP 修改为上面部署node_exporter机器的ip,端口号为9100,需要注意缩进。

相关文章
|
3月前
|
Prometheus 监控 Cloud Native
云原生监控实战:Prometheus+Grafana快速搭建指南
云原生监控实战:Prometheus+Grafana快速搭建指南
|
3月前
|
存储 Prometheus 监控
OSS监控体系搭建:Prometheus+Grafana实时监控流量、错误码、存储量(开源方案替代云监控自定义视图)
本方案基于Prometheus构建OSS监控系统,涵盖架构设计、指标采集、可视化、告警及性能优化,助力企业实现高可用、低成本的自建监控体系。
385 1
|
4月前
|
Prometheus 监控 Cloud Native
除了Prometheus,还有哪些工具可以监控Docker Swarm集群的资源使用情况?
除了Prometheus,还有哪些工具可以监控Docker Swarm集群的资源使用情况?
381 79
|
3月前
|
存储 监控 Cloud Native
云原生监控实战:Prometheus+Grafana打造RDS多维度预警体系
本方案构建了基于Prometheus与Thanos的云原生RDS监控体系,涵盖数据采集、存储、可视化与告警全流程。支持10万+QPS采集、90%存储压缩,具备<30秒告警延迟能力。通过自定义指标与智能预警策略,显著提升故障发现效率,实现分钟级响应。
299 5
|
3月前
|
Prometheus 监控 Cloud Native
|
2月前
|
Prometheus 监控 Cloud Native
Docker 部署 Prometheus 和 Grafana 监控 Spring Boot 服务
Docker 部署 Prometheus 和 Grafana 监控 Spring Boot 服务实现步骤
|
SQL 运维 监控
关系型数据库性能监控工具
【5月更文挑战第21天】
254 2
|
运维 监控 Java
(十)JVM成神路之线上故障排查、性能监控工具分析及各线上问题排错实战
经过前述九章的JVM知识学习后,咱们对于JVM的整体知识体系已经有了全面的认知。但前面的章节中,更多的是停留在理论上进行阐述,而本章节中则更多的会分析JVM的实战操作。
342 1
|
监控 Java 开发者
揭秘Struts 2性能监控:选对工具与方法,让你的应用跑得更快,赢在起跑线上!
【8月更文挑战第31天】在企业级应用开发中,性能监控对系统的稳定运行至关重要。针对流行的Java EE框架Struts 2,本文探讨了性能监控的工具与方法,包括商用的JProfiler、免费的VisualVM以及Struts 2自带的性能监控插件。通过示例代码展示了如何在实际项目中实施这些监控手段,帮助开发者发现和解决性能瓶颈,确保应用在高并发、高负载环境下稳定运行。选择合适的监控工具需综合考虑项目需求、成本、易用性和可扩展性等因素。
109 0
|
Java 开发者 前端开发
Struts 2、Spring MVC、Play Framework 上演巅峰之战,Web 开发的未来何去何从?
【8月更文挑战第31天】在Web应用开发中,Struts 2框架因强大功能和灵活配置备受青睐,但开发者常遇配置错误、类型转换失败、标签属性设置不当及异常处理等问题。本文通过实例解析常见难题与解决方案,如配置文件中遗漏`result`元素致页面跳转失败、日期格式不匹配需自定义转换器、`<s:checkbox>`标签缺少`label`属性致显示不全及Action中未捕获异常影响用户体验等,助您有效应对挑战。
181 0