prometheus监控ceph集群环境

2024-09-03 240

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

可观测监控 Prometheus 版，每月50GB免费额度

简介： 文章介绍了如何使用Prometheus监控Ceph集群环境，包括启用Prometheus模块、验证模块启用成功、访问Ceph的exporter、修改Prometheus配置文件、热加载配置，以及Grafana采集数据的方法。同时，还涵盖了监控Ceph集群宿主机的步骤，如在所有节点安装node-exporter、修改Prometheus配置文件、热加载配置，以及Grafana采集数据。

一.prometheus监控ceph集群环境

1.启用prometheus模块

[root@ceph141 ~]# ceph mgr module enable prometheus


Prometheus模块也是mgr组件的模块之一，用于Prometheus监控Ceph集群提供遍历。

参考链接:
    https://docs.ceph.com/en/nautilus/mgr/dashboard/#enabling-the-embedding-of-grafana-dashboards

2.验证模块是否启用成功

[root@ceph141 ~]# ceph mgr module ls | jq .enabled_modules
[
  "dashboard",
  "iostat",
  "prometheus",
  "restful"
]
[root@ceph141 ~]#

3.查看服务的访问地址

[root@ceph141 ~]# ceph mgr services
{
    "dashboard": "https://ceph141:8443/",
    "prometheus": "http://ceph141:9283/"
}
[root@ceph141 ~]# 
[root@ceph141 ~]# 
[root@ceph141 ~]# ss -ntl | grep 9283
LISTEN     0      5         [::]:9283                  [::]:*                  
[root@ceph141 ~]#

4.访问ceph的exporter

http://ceph141:9283/metrics

5.修改prometheus的配置文件

[root@prometheus-server31 ~]# vim /yinzhengjie/softwares/prometheus/prometheus.yml 
...
global:
  scrape_interval: 5s

scrape_configs:
  ...
  - job_name: "yinzhengjie_ceph_custom_metrics"
    static_configs:
    - targets:
      - 10.0.0.142:9283
[root@prometheus-server31 ~]

6.热加载配置

[root@prometheus-server31 ~]# curl -X POST http://10.0.0.31:9090/-/reload

7.grafana去prometheus采集数据

2842: 
    ceph集群模板

5336: 
    OSD模板

5342：
    存储池模板

二.监控ceph集群宿主机

1.ceph所有节点安装node-exporter

[root@ceph141 ~]# cat install-node-exporter.sh 
#!/bin/bash
# auther: JasonYin


VERSION=1.7.0
SOFTWARE=node_exporter-${VERSION}.linux-amd64.tar.gz
URL=https://github.com/prometheus/node_exporter/releases/download/v${VERSION}/${SOFTWARE}
DOWNLOAD=./download
INSTALLDIR=/yinzhengjie/softwares
BASEDIR=${INSTALLDIR}/node_exporter-${VERSION}.linux-amd64

# 判断目录是否存在，若不存在则创建
[ -d $INSTALLDIR ] || mkdir -pv ${INSTALLDIR}
[ -d $DOWNLOAD ] || mkdir -pv ${DOWNLOAD}

# 判断系统是否安装curl
# [ -f /usr/bin/wget ] || apt update && apt -y install wget

# 判断文件是否存在，若不存在则下载
[ -s ${DOWNLOAD}/${SOFTWARE} ] || wget $URL -O ${DOWNLOAD}/${SOFTWARE}

if [ $? -eq 0 ]; then
  # 解压文件软件包
  tar xf ${DOWNLOAD}/${SOFTWARE} -C ${INSTALLDIR}

  # 生成启动脚本
cat > /etc/systemd/system/node-exporter.service <<EOF
[Unit]
Description=yinzhengjie Linux Node Exporter
Documentation=https://prometheus.io/docs/introduction/overview/
After=network.target

[Service]
ExecStart=${BASEDIR}/node_exporter --web.listen-address=:9100

[Install]
WantedBy=multi-user.target
EOF

  # 将服务设置为开机自启动
  systemctl daemon-reload
  systemctl enable --now node-exporter.service
fi
[root@ceph141 ~]#
[root@ceph141 ~]# bash install-node-exporter.sh 
Created symlink from /etc/systemd/system/multi-user.target.wants/node-exporter.service to /etc/systemd/system/node-exporter.service.
[root@ceph141 ~]#

2.修改prometheus的配置文件

[root@prometheus-server31 ~]# vim /yinzhengjie/softwares/prometheus/prometheus.yml 
...
global:
  scrape_interval: 5s

scrape_configs:
  ...
  - job_name: "yinzhengjieceph-node-exporter"
    honor_labels: true
    static_configs:
    - targets:
      - 10.0.0.141:9100
      - 10.0.0.142:9100
      - 10.0.0.143:9100

3.热加载配置

[root@prometheus-server31 ~]# curl -X POST http://10.0.0.31:9090/-/reload

prometheus监控ceph集群环境

一.prometheus监控ceph集群环境

1.启用prometheus模块

2.验证模块是否启用成功

3.查看服务的访问地址

4.访问ceph的exporter

5.修改prometheus的配置文件

6.热加载配置

7.grafana去prometheus采集数据

二.监控ceph集群宿主机

1.ceph所有节点安装node-exporter

2.修改prometheus的配置文件

3.热加载配置

4.grafana去prometheus采集数据

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

prometheus监控ceph集群环境

一.prometheus监控ceph集群环境

1.启用prometheus模块

2.验证模块是否启用成功

3.查看服务的访问地址

4.访问ceph的exporter

5.修改prometheus的配置文件

6.热加载配置

7.grafana去prometheus采集数据

二.监控ceph集群宿主机

1.ceph所有节点安装node-exporter

2.修改prometheus的配置文件

3.热加载配置

4.grafana去prometheus采集数据

热门文章

最新文章

相关课程

相关电子书

相关实验场景