Prometheus的搜索结果_文章_第5页-阿里云开发者社区

大熊计算机

|

5月前

|

博文

|

来自：大数据与机器学习

大模型推理加速实战：vLLM 部署 Llama3 的量化与批处理优化指南

本文详解如何通过量化与批处理优化，在vLLM中高效部署Llama3大模型。涵盖内存管理、推理加速及混合策略，提升吞吐量并降低延迟，适用于大规模语言模型部署实践。

# 存储 # 编解码 # Prometheus # 监控 # 测试技术

大熊计算机

|

5月前

|

博文

|

来自：大数据与机器学习

机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程

本系统采用Prometheus与Evidently双引擎架构，实现从数据采集、智能分析到精准告警的全流程监控。通过时序数据与模型分析深度集成，支持数据漂移检测、性能评估及根因分析，结合Grafana可视化与Alertmanager智能路由，构建高可用、低延迟的监控体系，显著提升异常检测能力与系统稳定性。

# 机器学习/深度学习 # 存储 # Prometheus # 监控 # Cloud Native

站大爷

|

5月前

|

博文

当Python同时操作1000个文件时，为什么你的CPU只用了10%？

本文介绍如何构建一个高效的文件处理系统，解决单线程效率低、多线程易崩溃的矛盾。通过异步队列与多线程池结合，实现任务调度优化，提升I/O密集型操作的性能。

# 编解码 # Prometheus # Java # 调度 # Python

程序元宝

|

5月前

|

博文

模型被挤了？立即查看服务器GPU/CPU占用，别再误杀他人进程！

模型在服务器上跑得好好的，突然就“卡”了甚至被挤掉？别急着抱怨！本文手把手教你如何优雅地查看共享服务器的CPU和GPU占用情况，学会做一个有素质的“共享玩家”，告别模型被挤的尴尬！文末还有硬核忠告和Linux学习建议。

# GPU云服务器 # Prometheus # 监控 # 数据可视化 # Linux # 异构计算

大熊计算机

|

5月前

|

博文

|

来自：云存储

OSS监控体系搭建：Prometheus+Grafana实时监控流量、错误码、存储量（开源方案替代云监控自定义视图）

本方案基于Prometheus构建OSS监控系统，涵盖架构设计、指标采集、可视化、告警及性能优化，助力企业实现高可用、低成本的自建监控体系。

# 云监控 # 可观测可视化 Grafana 版 # 对象存储 # 存储 # Prometheus # 监控 # Cloud Native # 对象存储

程序员小假

|

5月前

|

博文

如何使用 Spring Boot Prometheus Grafana 来打造可视化监控？

我是小假期待与你的下一次相遇 ~

# 可观测可视化 Grafana 版 # Prometheus # 监控 # Cloud Native # Java # Spring

Echo_Wish

|

5月前

|

博文

|

来自：弹性计算

“服务器罢工前的预言术”：用AI预测系统状态真香指南

# 人工智能 # 运维 # Prometheus # 监控 # Cloud Native

Echo_Wish

|

5月前

|

博文

|

来自：弹性计算

运维不背锅，从“自动修锅”开始：AI自动化运维是怎么回事？

# 机器学习/深度学习 # 人工智能 # 运维 # Prometheus # 容器

程序员小假

|

5月前

|

博文

|

来自：阿里云百炼

Spring Boot 可视化监控

本文介绍了如何通过Spring Actuator、Micrometer、Prometheus和Grafana为Spring Boot应用程序添加监控功能。首先创建了一个Spring Boot应用，并配置了Spring Actuator以暴露健康状态和指标接口。接着，利用Micrometer收集应用性能数据，并通过Prometheus抓取这些数据进行存储。最后，使用Grafana将Prometheus中的数据可视化，展示在精美的仪表板上。整个过程简单易行，为Spring Boot应用提供了基本的监控能力，同时也为后续扩展更详细的监控指标奠定了基础。

# Prometheus # 监控 # Cloud Native # Java # Spring

阿里云云原生

|

6月前

|

博文

|

来自：云原生

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

PromQL AI 智能体上线。本文将从自然语言生成 PromQL 实践视角，探讨如何构建知识库、与大模型进行交互、最终生成符合需求的 PromQL 语句。本文还介绍了在 MCP 和云监控控制台下使用 AI 智能体的用例。

# 人工智能 # 自然语言处理 # Prometheus # Cloud Native # 容器

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Prometheus