Prometheus+Grafana监控Linux主机

简介: 通过本文的步骤,我们成功地在 Linux 主机上使用 Prometheus 和 Grafana 进行了监控配置。具体包括安装 Prometheus 和 Node Exporter,配置 Grafana 数据源,并导入预设的仪表盘来展示监控数据。通过这种方式,可以轻松实现对 Linux 主机的系统指标监控,帮助及时发现和处理潜在问题。

使用 Prometheus 和 Grafana 监控 Linux 主机

Prometheus 和 Grafana 是当前流行的监控和可视化工具。Prometheus 是一个开源的系统监控和报警工具,而 Grafana 是一个开源的度量分析和可视化工具。两者结合使用,可以实现强大的监控和数据展示功能。本文将介绍如何在 Linux 主机上使用 Prometheus 和 Grafana 进行监控。

一、环境准备

在开始之前,请确保你已经安装了以下软件:

  • Linux 主机(本文以 Ubuntu 为例)
  • Docker 和 Docker Compose(用于简化安装过程)

1. 安装 Docker 和 Docker Compose

在 Ubuntu 上安装 Docker:

sudo apt-get update
sudo apt-get install -y docker.io
​

安装 Docker Compose:

sudo apt-get install -y docker-compose
​

二、安装 Prometheus

2.1 创建 Prometheus 配置文件

创建一个目录来存放 Prometheus 配置文件:

mkdir -p ~/prometheus
cd ~/prometheus
​

在该目录下创建 prometheus.yml 配置文件:

nano prometheus.yml
​

添加以下内容到 prometheus.yml

global:
  scrape_interval: 15s

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['localhost:9090']

  - job_name: 'node_exporter'
    static_configs:
      - targets: ['localhost:9100']
​

2.2 使用 Docker 启动 Prometheus

~/prometheus 目录下创建 docker-compose.yml 文件:

nano docker-compose.yml
​

添加以下内容到 docker-compose.yml

version: '3.7'
services:
  prometheus:
    image: prom/prometheus
    container_name: prometheus
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
    ports:
      - "9090:9090"
​

启动 Prometheus:

docker-compose up -d
​

三、安装 Node Exporter

Node Exporter 是 Prometheus 官方提供的用于采集主机指标的工具。

3.1 使用 Docker 启动 Node Exporter

~/prometheus 目录下更新 docker-compose.yml 文件:

version: '3.7'
services:
  prometheus:
    image: prom/prometheus
    container_name: prometheus
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
    ports:
      - "9090:9090"

  node_exporter:
    image: prom/node-exporter
    container_name: node_exporter
    ports:
      - "9100:9100"
​

启动 Node Exporter:

docker-compose up -d
​

四、安装 Grafana

4.1 使用 Docker 启动 Grafana

~/prometheus 目录下更新 docker-compose.yml 文件:

version: '3.7'
services:
  prometheus:
    image: prom/prometheus
    container_name: prometheus
    volumes:
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
    ports:
      - "9090:9090"

  node_exporter:
    image: prom/node-exporter
    container_name: node_exporter
    ports:
      - "9100:9100"

  grafana:
    image: grafana/grafana
    container_name: grafana
    ports:
      - "3000:3000"
    volumes:
      - grafana-storage:/var/lib/grafana

volumes:
  grafana-storage:
​

启动 Grafana:

docker-compose up -d
​

五、配置 Grafana

5.1 访问 Grafana

在浏览器中访问 http://localhost:3000。默认用户名和密码都是 admin。首次登录后会要求更改密码。

5.2 添加数据源

  1. 登录 Grafana 后,点击左侧菜单中的“齿轮”图标,选择“Data Sources”。
  2. 点击“Add data source”。
  3. 选择“Prometheus”。
  4. 在“HTTP”下的“URL”中输入 http://prometheus:9090
  5. 点击“Save & Test”确保数据源配置正确。

5.3 导入仪表盘

  1. 在 Grafana 主界面,点击左侧菜单中的“加号”图标,选择“Import”。
  2. 在“Import via grafana.com”中输入仪表盘的 ID(例如,1860 是一个常用的 Node Exporter 全局仪表盘 ID)。
  3. 点击“Load”。
  4. 在“Prometheus”数据源下拉菜单中选择刚刚配置的数据源。
  5. 点击“Import”。

六、查看监控数据

在 Grafana 的仪表盘中,可以看到从 Prometheus 和 Node Exporter 收集到的各种系统指标,包括 CPU 使用率、内存使用率、磁盘 I/O 等等。

七、总结

通过本文的步骤,我们成功地在 Linux 主机上使用 Prometheus 和 Grafana 进行了监控配置。具体包括安装 Prometheus 和 Node Exporter,配置 Grafana 数据源,并导入预设的仪表盘来展示监控数据。通过这种方式,可以轻松实现对 Linux 主机的系统指标监控,帮助及时发现和处理潜在问题。

目录
相关文章
|
3天前
|
弹性计算 人工智能 安全
对话 | ECS如何构筑企业上云的第一道安全防线
随着中小企业加速上云,数据泄露、网络攻击等安全威胁日益严重。阿里云推出深度访谈栏目,汇聚产品技术专家,探讨云上安全问题及应对策略。首期节目聚焦ECS安全性,提出三道防线:数据安全、网络安全和身份认证与权限管理,确保用户在云端的数据主权和业务稳定。此外,阿里云还推出了“ECS 99套餐”,以高性价比提供全面的安全保障,帮助中小企业安全上云。
对话 | ECS如何构筑企业上云的第一道安全防线
|
11天前
|
调度 云计算 芯片
云超算技术跃进,阿里云牵头制定我国首个云超算国家标准
近日,由阿里云联合中国电子技术标准化研究院主导制定的首个云超算国家标准已完成报批,不久后将正式批准发布。标准规定了云超算服务涉及的云计算基础资源、资源管理、运行和调度等方面的技术要求,为云超算服务产品的设计、实现、应用和选型提供指导,为云超算在HPC应用和用户的大范围采用奠定了基础。
179614 22
|
20天前
|
人工智能 自然语言处理 前端开发
从0开始打造一款APP:前端+搭建本机服务,定制暖冬卫衣先到先得
通义灵码携手科技博主@玺哥超carry 打造全网第一个完整的、面向普通人的自然语言编程教程。完全使用 AI,再配合简单易懂的方法,只要你会打字,就能真正做出一个完整的应用。
9591 28
|
6天前
|
机器学习/深度学习 分布式计算 供应链
阿里云先知安全沙龙(上海站) ——大模型基础设施安全攻防
大模型基础设施的安全攻防体系涵盖恶意输入防御和基础设施安全,包括框架、三方库、插件、平台、模型和系统安全。关键漏洞如CVE-2023-6019(Ray框架命令注入)、CVE-2024-5480(PyTorch分布式RPC)及llama.cpp中的多个漏洞,强调了代码安全性的重要性。模型文件安全方面,需防范pickle反序列化等风险,建议使用Safetensors格式。相关实践包括构建供应链漏洞库、智能化漏洞分析和深度检测,确保全方位防护。
|
4天前
|
存储 缓存 运维
阿里云先知安全沙龙(上海站)——后渗透阶段主机关键信息自动化狩猎的实现与应用
本文介绍了在后渗透测试中使用LSTAR工具和PowerShell脚本进行RDP状态查询、端口获取及凭据收集的过程,强调了高强度实战场景下的OPSEC需求。通过MITRE ATT&CK框架的应用,详细阐述了凭证访问、发现和收集等关键技术,确保攻击者能够隐蔽、持续且高效地渗透目标系统,最终获取核心数据或控制权。文中还展示了SharpHunter等工具的自动化实现,进一步提升了操作的安全性和效率。
|
4天前
|
机器学习/深度学习 人工智能 安全
通义视觉推理大模型QVQ-72B-preview重磅上线
Qwen团队推出了新成员QVQ-72B-preview,这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色,尤其在数学推理任务中取得了显著进步。尽管如此,该模型仍存在一些局限性,仍在学习和完善中。
|
24天前
|
Cloud Native Apache 流计算
资料合集|Flink Forward Asia 2024 上海站
Apache Flink 年度技术盛会聚焦“回顾过去,展望未来”,涵盖流式湖仓、流批一体、Data+AI 等八大核心议题,近百家厂商参与,深入探讨前沿技术发展。小松鼠为大家整理了 FFA 2024 演讲 PPT ,可在线阅读和下载。
5185 15
资料合集|Flink Forward Asia 2024 上海站
|
1月前
|
人工智能 自动驾驶 大数据
预告 | 阿里云邀您参加2024中国生成式AI大会上海站,马上报名
大会以“智能跃进 创造无限”为主题,设置主会场峰会、分会场研讨会及展览区,聚焦大模型、AI Infra等热点议题。阿里云智算集群产品解决方案负责人丛培岩将出席并发表《高性能智算集群设计思考与实践》主题演讲。观众报名现已开放。
|
16天前
|
Docker 容器
|
5天前
|
监控 NoSQL Java
若依RuoYi项目环境搭建教程(RuoYi-Vue + RuoYi-Vue3版本)
若依(RuoYi)是一款基于Spring Boot和Vue.js的开源Java快速开发脚手架,支持OAuth2、JWT鉴权,集成多种安全框架和持久化框架。它提供了系统管理、监控管理、任务调度、代码生成等常用功能模块,适合中小型公司快速搭建Web应用。本文主要介绍若依框架的特点、版本发展、优缺点及项目部署步骤,帮助开发者快速上手并部署若依项目。
若依RuoYi项目环境搭建教程(RuoYi-Vue + RuoYi-Vue3版本)