Prometheus

首页 标签 Prometheus
# Prometheus #
关注
2520内容
Python+AI实战:从零构建智能图像识别系统(三)
教程来源 https://yyvgt.cn/category/jiuwenhua.html 本文构建了完整的智能商品分类系统,涵盖数据处理、EfficientNet模型训练(支持AMP、EMA、早停)、ONNX/TensorRT优化、FastAPI部署、Celery异步任务、Prometheus监控、A/B测试及主动学习等全链路AI工程实践。
|
12天前
| |
来自: 数据库
MySQL性能拉胯、故障难排查?Prometheus+Grafana+Zabbix搭建全流程监控体系,秒定位问题!
本文详解如何用Prometheus(采集)、Grafana(可视化)、Zabbix(告警)三工具联动,构建MySQL性能监控与故障排查闭环体系,覆盖实时监控、智能预警、精准定位、优化治理,助运维/DBA告别被动救火,提升系统稳定性与响应效率。(239字)
|
16天前
|
从零构建 Mini-vLLM:KV-Cache、动态批处理与分布式推理全流程
Mini-vLLM 是一个从零打造的高效推理引擎,直击 HuggingFace `.generate()` 的 O(N²) 注意力瓶颈。通过手动实现 KV 缓存、动态批处理、gRPC 通信、Prometheus/Grafana 可观测性、分布式多 worker 架构及 Docker 容器化,显著提升吞吐与延迟。纯 CPU 下达 1307+ req/s,目标是真正理解而非复用轮子。
DMXAPI + Prometheus MCP Tool:我如何把监控查询、告警排查和 LLM 分析串成闭环
本文探讨如何将Prometheus MCP Tool深度融入真实监控分析流程,让大模型从“看图猜因”升级为基于证据链的主动排障助手。聚焦CPU飙升、延迟异常等典型问题,强调数据形状比模型更重要——通过结构化查询(QPS、P95、错误率等)、语义保真PromQL、可控分析流程,构建可验证、可复现、工程师可信的AI辅助系统。(239字)
|
21天前
| |
来自: 弹性计算
回滚是“等时间”还是“看指标”?别再拍脑袋了,这一步决定你系统生死
回滚是“等时间”还是“看指标”?别再拍脑袋了,这一步决定你系统生死
你还在“出问题才查日志”?用 Prometheus + Grafana,把大数据平台变成“会说话”的系统!
你还在“出问题才查日志”?用 Prometheus + Grafana,把大数据平台变成“会说话”的系统!
|
23天前
|
阿里云、本地部署OpenClaw 实现全维度监控运维指南:从基础监控到企业级告警体系搭建
OpenClaw 作为开源 AI 智能体执行网关,其稳定运行是自动化任务落地的核心前提。部署后的全维度监控并非单一指标追踪,而是覆盖「网关 - 智能体 - 技能 - 资源」四层架构的全链路管控,核心价值在于提前识别风险、定位故障根因、保障任务执行效率,避免因系统宕机、权限异常、资源耗尽导致业务中断。本文系统讲解 OpenClaw 监控维度、基础与进阶监控工具实操、故障排查方法,同时提供 2026 年阿里云及本地多系统部署流程、阿里云百炼免费大模型配置,所有命令可直接复制执行,助力个人与企业用户搭建稳定可控的运维体系。
Grafana+Loki+Alloy构建企业级日志平台
Loki是一个水平可扩展、高可用的多租户日志聚合系统,其设计灵感来自Prometheus。与Prometheus不同,Loki专注于日志处理,采用推送方式收集日志,并通过标签索引而非日志内容实现高效查询。其架构包含Distributor、Ingester和Querier等组件,分别负责请求分发、日志存储和查询处理。Loki将日志数据压缩存储在对象存储中,大大降低了成本。部署时,可结合Grafana Alloy作为日志收集器,并通过Grafana可视化界面或LogQL查询语言进行日志检索和分析。系统支持多种查
Prometheus+Grafana构建企业级监控方案
Prometheus是一种开源的监控系统,通过时间序列数据库存储指标数据,支持多维数据模型和PromQL查询语言。其工作原理是通过HTTP拉取应用暴露的指标(如SpringBoot的Actuator端点),并持久化存储。示例展示了SpringBoot整合Prometheus的过程,包括依赖引入、配置暴露指标端点,以及通过Docker部署应用。最后介绍了Prometheus与Grafana的集成,通过配置数据源和仪表板实现可视化监控。整个方案适用于内网部署,支持服务发现和多种中间件监控。
|
1月前
| |
来自: 云原生
断网、断电,不断数据——LoongCollector 极限边缘场景可靠采集方案
LoongCollector 专为边缘环境深度优化,确保“断网不断采、断电不丢数”。
免费试用