[基础服务] Grafana/Prometheus/node-exporter 的安装和部署

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
可观测可视化 Grafana 版,10个用户账号 1个月
可观测监控 Prometheus 版,每月50GB免费额度
简介: [基础服务] Grafana/Prometheus/node-exporter 的安装和部署

简介

其实这种像Grafana 这种无状态应用非常适合使用docker来部署,后续扩展迁移可以完全保证环境的一致性。
下面我们使用docker快速部署一个Grafana 服务

监控端安装:
Prometheus Server(普罗米修斯监控主服务器 )
Node Exporter (收集Host硬件和操作系统信息)
cAdvisor (负责收集Host上运行的容器信息)
Grafana (展示普罗米修斯监控界面)

被监控安装:
Node Exporter (收集Host硬件和操作系统信息)
cAdvisor (负责收集Host上运行的容器信息)

方法 / 步骤

一: 安装 Grafana

🔗 Docker-Hub仓库

# 拉取最新 grafana:9.1.0版本
docker pull grafana/grafana:9.1.0

# 生成预配置
docker run -d \
--name grafana3000 \
-p 3000:3000 \
grafana/grafana:9.1.0
  • ip:3000端口打开

在这里插入图片描述

1.1: 配置文件进行挂载

docker cp grafana:/etc/grafana/. /docker/grafana3000/conf
docker cp grafana:/var/lib/grafana/. /docker/grafana3000/data
docker cp grafana:/var/log/grafana/. /docker/grafana3000/log 

1.2 编辑用户分组信息 (重要)

# 添加用户
useradd grafana

# 指定用户UID信息
vi /etc/passwd

--------- 官方约定grafana用户UID和GID都为472--------------
grafana:x:472:472::/home/grafana:/bin/bash
---------------------------------------------------------

# 编辑用户分组信息
vi /etc/group

---------------
grafana:x:472:
---------------



# 赋予账户权限
chown -R grafana:grafana  /docker/grafana3000
# 查看目录所属信息
ls -lhat /docker/grafana3000

官方文档链接
在这里插入图片描述

1.3 : 安装并检测

docker run -d \
--name grafana3000 \
-p 3000:3000 \
-v /docker/grafana3000/conf:/etc/grafana \
-v /docker/grafana3000/data:/var/lib/grafana \
-v /docker/grafana3000/log:/var/log/grafana \
-v /etc/localtime:/etc/localtime:ro \
--restart=always \
grafana/grafana:9.1.0

1.4 查看是否在运行:

docker ps -l

查看启动日志:

docker logs grafana3000 

如果没有启动成功的话,可以排查一下挂载的目录是否正确,比如是否配了目录权限等。

在这里插入图片描述
在这里插入图片描述

二: 部署并启动 Prometheus Server

Docker-Hub

# 选择最新2.38.0版本
docker pull prom/prometheus:v2.38.0

# 创建prometheus.yml文件
mkdir /docker/prometheus9090
cd /docker/prometheus9090
vim prometheus.yml
  • 编写yml文件 (一定要注意格式,否则会报错)
global:
  scrape_interval: 15s
  evaluation_interval: 15s
scrape_configs:
  - job_name: 'prometheus'
    static_configs:
    - targets: ['localhost:9090']
  • 运行
docker run -d \
--name=prometheus9090 \
-p 9090:9090 \
-v /docker/prometheus9090/prometheus.yml:/etc/prometheus/prometheus.yml \
--restart=always \
prom/prometheus:v2.38.0
  • 查看是否安装成功

http://ip:9090

在这里插入图片描述

  • 查看监控的数据

http://服务器IP:9090/metrics可以查看到监控的数据
在这里插入图片描述
在这里插入图片描述
下面就监控远程Linux主机, 在被监控端上安装node_exporter组件了

三: 部署并启动 node-exporter

不建议将其部署为Docker容器,因为它需要访问主机系统。请注意,您要监视的任何非根安装点都需要绑定到容器中。如果启动容器以进行主机监视,请指定path.rootfs参数。

Docker-Hub

# 拉取镜像(取最新稳定版本)
docker pull prom/node-exporter:v1.3.1

# node-expoter 默认端口号是9100
# 启动命令
docker run -d \
--net="host" \
--name node_exporter \
--restart=unless-stopped -p 9100:9100 \
-v "/proc:/host/proc:ro" \
-v "/sys:/host/sys:ro" \
-v "/:/rootfs:ro" \
--restart=always \
prom/node-exporter:v1.3.1

在这里插入图片描述

启动后通过
http://IP:9100/metrics 查看是否启动成功 (包含指标数据为启动成功)
在这里插入图片描述

五: 整合配置

5.1 到prometheus配置添加监控机器

# 更改配置文件
vi /docker/prometheus9090/prometheus.yml 

# job_name 给被监控主机取个名字,我这里直接填的IP
# targets 填写被监控主机的IP和端口
  - job_name: 'nasvm0-exporter'      
    static_configs:
    - targets: ['192.168.11.100:9100']

改完配置文件后,重启服务

docker restart  [CONTAINER ID]

打开prometheus

在这里插入图片描述

5.2 在Grafana上添加Prometheus 服务数据源

我们把prometheus服务器收集的数据做为一个数据源添加到grafana,让grafana可以得到prometheus的数据
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  • 返回配置我们可以看到已经添加的数据源

在这里插入图片描述

5.3 Grafana图形显示Linux硬件信息

在🔗Grafana官方提供模板 中寻找 🔗 本次要导入的模板,该插件里面包含:CPU 内存 磁盘IO 网络, 温度和其他监控指标

在这里插入图片描述

  • 面板里面选择导入

在这里插入图片描述

在这里插入图片描述
将面板ID填入,选择数据源,点击导入

在这里插入图片描述

  • 导入成功

在这里插入图片描述

六: 监控报警

  • prometheus配合alertmanager这个组件报警,报警规则需要手动编写,这需要对prometheus+alertmanager有一定的了解
  • grafana配合SaaS模式的云告警平台onealert报警,onealert也是需要时间熟悉的
  • 这里演示最传统的grafana+email报警

6.1 修改grafana配置文件,添加发件邮箱

❗❗注意:如果smtp邮箱的25端口被禁用,如果出现发送超时可以改成465端口重试
🔗 相关邮箱服务地址查询


vi /docker/grafana3000/conf/grafana.ini
# 找到smtp关键字
#################################### SMTP / Emailing ##########################
[smtp]
enabled = true  # 改成true
host = smtp.exmail.qq.com:465   # 发送服务器地址和端口
user =   # 这里填写发件邮箱
# If the password contains # or ; you have to wrap it with triple quotes. Ex """#password;"""
password =  # 这里填写发件邮箱密码或授权密码
;cert_file =
;key_file =
skip_verify = true  # 改成true
from_address =  # 这里填写发件邮箱
;from_name = Grafana
# EHLO identity in SMTP dialog (defaults to instance_name)
;ehlo_identity = dashboard.example.com
# SMTP startTLS policy (defaults to 'OpportunisticStartTLS')
;startTLS_policy = NoStartTLS

6.2 在通知模块创建收件人组

在这里插入图片描述

  • 建立联系点

在这里插入图片描述

在这里插入图片描述
然后发送成功
在这里插入图片描述

参考资料 & 致谢

[1] Grafana监控

相关实践学习
通过可观测可视化Grafana版进行数据可视化展示与分析
使用可观测可视化Grafana版进行数据可视化展示与分析。
目录
相关文章
|
4天前
|
缓存 JavaScript 安全
2022年最新最详细的安装Node.js以及cnpm(详细图解过程、绝对成功)
这篇文章提供了2022年最新最详细的Node.js和cnpm安装教程,包括步骤图解、全局配置路径、cnpm安装命令、nrm的安装与使用,以及如何管理npm源和测试速度。
2022年最新最详细的安装Node.js以及cnpm(详细图解过程、绝对成功)
|
1天前
|
JavaScript
成功解决node、node-sass和sass-loader版本冲突问题、不需要降低node版本。如何在vue项目中安装node-sass,以及安装node-sass可能遇到的版本冲突问题
这篇文章介绍了在Vue项目中安装node-sass和sass-loader时遇到的版本冲突问题,并提供了解决这些问题的方法,包括在不降低node版本的情况下成功安装node-sass。
成功解决node、node-sass和sass-loader版本冲突问题、不需要降低node版本。如何在vue项目中安装node-sass,以及安装node-sass可能遇到的版本冲突问题
|
4天前
Mac 安装 Node Error: Could not symlink include/node/common.gypi
Mac 安装 Node Error: Could not symlink include/node/common.gypi
9 3
|
5天前
|
JavaScript
Node.js的安装
这篇文章提供了Node.js的安装指南,包括从官网下载、安装步骤、验证安装是否成功,以及如何安装淘宝镜像加速器cnpm或使用淘宝npm镜像来加速npm包的安装过程。
Node.js的安装
|
1天前
|
JavaScript Linux
2022年超详细在CentOS 7上安装Node.js方法(源码安装)
这篇文章介绍了在CentOS 7系统上通过源码安装Node.js的详细步骤,包括从官网下载Node.js源码包、将安装包上传至虚拟机、解压安装包、删除压缩文件、编译安装Node.js、检查Node.js和npm版本,以及切换npm源到淘宝镜像以加速下载。此外,还提供了一个获取Linux下Node.js离线安装包的微信公众号搜索方式。
|
5天前
|
JavaScript 前端开发 Ubuntu
如何在 VPS 上安装 Express(Node.js 框架)并设置 Socket.io
如何在 VPS 上安装 Express(Node.js 框架)并设置 Socket.io
11 0
|
5天前
|
JavaScript Windows
记一下 Windows11 安装与配置 node.js 的标准步骤
这篇文章记录了在Windows 11系统上安装和配置Node.js的步骤,包括安装Node.js、验证安装、配置npm、设置npm镜像加速、全局安装cnpm并配置镜像、解决TLS连接不安全警告的详细过程。
13 0
|
2月前
|
Prometheus 监控 Cloud Native
基于Prometheus和Grafana的监控平台 - 环境搭建
基于Prometheus和Grafana的监控平台 - 环境搭建
|
6天前
|
Prometheus Kubernetes 监控
Kubernetes(K8S) 监控 Prometheus + Grafana
Kubernetes(K8S) 监控 Prometheus + Grafana
22 2
|
12天前
|
Prometheus 监控 Cloud Native
在 HBase 集群中,Prometheus 通常监控哪些类型的性能指标?
在 HBase 集群中,Prometheus 通常监控哪些类型的性能指标?