Prometheus+Grafana构建企业级监控方案

简介: Prometheus是一种开源的监控系统,通过时间序列数据库存储指标数据,支持多维数据模型和PromQL查询语言。其工作原理是通过HTTP拉取应用暴露的指标(如SpringBoot的Actuator端点),并持久化存储。示例展示了SpringBoot整合Prometheus的过程,包括依赖引入、配置暴露指标端点,以及通过Docker部署应用。最后介绍了Prometheus与Grafana的集成,通过配置数据源和仪表板实现可视化监控。整个方案适用于内网部署,支持服务发现和多种中间件监控。

 1.prometheus工作原理:

Prometheus将指标收集并存储为时间序列数据库(时序数据库),即指标信息与记录它的时间戳一起存储,以及称为标签的可选键值对。

特性:

具有由指标名称和键/值对识别的时间序列数据的多维数据模型

·PromQL,一种利用此维度的灵活查询语言

不依赖集中式存储;单个服务器节点是自治的

时间序列收集通过http上的拉模型进行

通过中间网关支持推送时间序列

通过服务发现或静态配置发现目标

多种图形和仪表板支持模式

指标:

指标是通俗意义上的数值测量。时间序列是指记录随时间的变化。用户想要衡量的指标因应用而异。对于Web 服务器,可能是请求时间;对于数据库,可能是活动连接数或活动查询数,等等

指标在了解应用程序为何以某种方式工作方面发挥着重要作用。假设您正在运行一个Web 应用程序,并发现它很慢。为了了解应用程序发生了什么,您需要一些信息。例如,当请求数量很高时,应用程序可能会变慢。如果您有请求计数指标,则可以确定原因并增加服务器数量以处理负载。

工作原理:

应用服务通过导出器暴露自己的指标,Prometheus定时去拉取导出器暴露的数据,然后数据会持久化落盘做时序数据库存储,客户端如Grafana会通过PromQL查询Prometheus中的指标数据。exporter导出器相当于一个Web应用,遵循Prometheus协议,导出器完成两件事:拿到指标,然后封装指标。

image.gif 编辑

SpringBoot会自带一个actuator,相当于导出器的功能,可以暴露监控指标

为了安全考虑,我们通常将监控服务部署在内网,部署架构如下:

image.gif 编辑

2.SpringBoot整合Prometheus示例

1.新建SpringBoot项目并引入监控相关核心依赖

<dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-actuator</artifactId>
        </dependency>
<!--        rometheus 注册表实现,用于将应用的度量指标按照 Prometheus 的格式进行暴露。-->
        <dependency>
            <groupId>io.micrometer</groupId>
            <artifactId>micrometer-registry-prometheus</artifactId>
            <scope>runtime</scope>
        </dependency>

image.gif

2.配置application.yml

spring:
  application:
    name: spring-boot-prometheus-demo
# 暴露所有监控指标
management:
  endpoints:
    web:
      exposure:
        include: "*"

image.gif

3.查看指标

查看暴露的指标列表:

localhost:8080/actuator/metrics

image.gif 编辑

查看某一详细指标(上述路径+具体指标):

localhost:8080/actuator/metrics/disk.free

image.gif 编辑

刷新页面,上述监控数据实时变化

查看prometheus格式的数据:

localhost:8080/actuator/prometheus

image.gif 编辑

一条指标的格式:

image.gif 编辑

3.Promethus+Grafana整合实战整合

image.gif 编辑

1.Docker部署项目

项目打jar包并编写如下的Dockerfile文件:

# 一个镜像就是一个小型linux系统
# 基础运行环境
FROM openjdk:17
# 把产品复制到运行环境的linux系统中 /app 目录下,改名叫 boot.jar
COPY target/*.jar /app/boot.jar
# 启动占用端口
EXPOSE 9090
# 应用启动命令 'java -jar /app/boot.jar';
# CMD 可以被启动的时候重新修改,、
# ENTRYPOINT(入口),不能被启动的时候修改
ENTRYPOINT ["java","-jar","/app/boot.jar"]

image.gif

将项目整体打成压缩包并上传到服务器,在服务解压压缩包并进入项目目录

执行指令构建镜像:

docker build -f Dockerfile -t boot-app:v1.0 .

image.gif

image.gif 编辑

根据镜像起服务容器:

docker run -d -p 6379:9090 --name boot boot-app:v1.0

image.gif

image.gif 编辑

成功从外网访问监控:

image.gif 编辑

2.配置Prometheus

创建配置存放路径

image.gif 编辑

在此路径下创建 prometheus.yml编写配置内容:

global :
scrape_interval:15 #抓取配置
sevaluation_interval:15s #计算
scrape_configs:
 -job_name:'prometheus' #抓取自己指标
  static_configs:
   -targets:['localhost:9090']
 -job_name:'bootapp-exporter'
  metrics_path:'/actuator/prometheus' #指定抓取的路径
  static_configs:
    -targets:['172.20.221.50:9090']# 注意改为服务器私有IP地址
     labels :
       appname:'bootapp

image.gif

启动prometheus

回到根目录下创建compose.yaml文件,批量启动应用:prometheus,grafana

name: prom
services:
  prometheus:
    image: prom/prometheus
    container_name:prometheus
    restart: always
    volumes 
      -/app/prom/conf/prometheus.yml:/etc/prometheus/prometheus.yml
      -/etc/localtime:/etc/localtime:ro
    ports:
      -"6379:9090'
    networks:
      - backend
      
grafana :
  image: grafana/grafana
  container_name:grafana
  restart: always
  volumes:
    -/etc/localtime:/etc/localtime:ro
  depends_on:
    - prometheus
  ports:
    -"3306:3306'
  networks:
    - backend
    
  networks:
    backend
      name: backend

image.gif

批量启动服务:

docker compose -f compose.yaml up -d

image.gif

服务启动,访问promethus端口,进入promethus监控

image.gif 编辑

登录进入Grafana登录页面

image.gif 编辑

配置promethus数据源

image.gif 编辑

查看某些指标

image.gif 编辑

配置监控面板

image.gif 编辑

image.gif 编辑

主机,数据库等中间件的监控同理配置


相关文章
|
5天前
|
人工智能 JSON 机器人
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
本文带你零成本玩转OpenClaw:学生认证白嫖6个月阿里云服务器,手把手配置飞书机器人、接入免费/高性价比AI模型(NVIDIA/通义),并打造微信公众号“全自动分身”——实时抓热榜、AI选题拆解、一键发布草稿,5分钟完成热点→文章全流程!
10721 62
让龙虾成为你的“公众号分身” | 阿里云服务器玩Openclaw
|
4天前
|
人工智能 IDE API
2026年国内 Codex 安装教程和使用教程:GPT-5.4 完整指南
Codex已进化为AI编程智能体,不仅能补全代码,更能理解项目、自动重构、执行任务。本文详解国内安装、GPT-5.4接入、cc-switch中转配置及实战开发流程,助你从零掌握“描述需求→AI实现”的新一代工程范式。(239字)
3063 126
|
1天前
|
人工智能 自然语言处理 供应链
【最新】阿里云ClawHub Skill扫描:3万个AI Agent技能中的安全度量
阿里云扫描3万+AI Skill,发现AI检测引擎可识别80%+威胁,远高于传统引擎。
1195 1
|
11天前
|
人工智能 JavaScript API
解放双手!OpenClaw Agent Browser全攻略(阿里云+本地部署+免费API+网页自动化场景落地)
“让AI聊聊天、写代码不难,难的是让它自己打开网页、填表单、查数据”——2026年,无数OpenClaw用户被这个痛点困扰。参考文章直击核心:当AI只能“纸上谈兵”,无法实际操控浏览器,就永远成不了真正的“数字员工”。而Agent Browser技能的出现,彻底打破了这一壁垒——它给OpenClaw装上“上网的手和眼睛”,让AI能像真人一样打开网页、点击按钮、填写表单、提取数据,24小时不间断完成网页自动化任务。
2554 6
|
25天前
|
人工智能 JavaScript Ubuntu
5分钟上手龙虾AI!OpenClaw部署(阿里云+本地)+ 免费多模型配置保姆级教程(MiniMax、Claude、阿里云百炼)
OpenClaw(昵称“龙虾AI”)作为2026年热门的开源个人AI助手,由PSPDFKit创始人Peter Steinberger开发,核心优势在于“真正执行任务”——不仅能聊天互动,还能自动处理邮件、管理日程、订机票、写代码等,且所有数据本地处理,隐私完全可控。它支持接入MiniMax、Claude、GPT等多类大模型,兼容微信、Telegram、飞书等主流聊天工具,搭配100+可扩展技能,成为兼顾实用性与隐私性的AI工具首选。
24364 122

热门文章

最新文章