官方博客-第12页-阿里云开发者社区

悦达

2025-03-21

1138

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,138

阿里云云原生

2025-04-29

676

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

676

阿里云云原生

2024-05-15

93568

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测为切入点，对比 OpenTelemetry 与 Prometheus 的相同与差异，重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

阿里云云原生

93,568

澄潭钰诚

2024-07-19

21943

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

21,943

阿里云云原生

2024-09-25

771

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

771

阿里云开发者

2024-11-29

1119

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,119

信徒

2024-12-05

829

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

本文详细记录了作者在处理HSF调用异常问题的过程中，从初步怀疑死锁到最终发现并解决活锁问题的全过程。

信徒

829

阿里云大数据Al技术

2024-05-15

145474

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,474

张晓锐

2024-05-15

935

利用CEN-TR实现企业级云上网络架构最佳实践

随着云计算的普及，越来越多的传统企业客户也在选择把IDC的业务系统搬到公共云上，实现更大的弹性、更强的灵活性、更高的性价比。但与泛互联网型企业的轻资产相比，传统企业的云下IT规模较大，有比较沉重历史包袱重，以及各种行业安全规范的约束，所以对于网络的规划设计、部署使用、运维管理都有自己的要求，仅仅具备云产品的初级使用能力已不能满足实际使用需求。企业级云上网络架构的重点是帮助企业用户更高效地搭建安全可靠的云上网络架构，本文主要针对企业客户在云上的南北向流量（访问internet/被internet用户访问）和东西向流量（企业内部VPC互访）的互访、安全、管理等多方面需求，利用CEN-TR（云企业网企业版）实现云上东西向+南北向流量安全和统一公网出口的最佳实践。

张晓锐

935

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

监控vLLM等大模型推理性能

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

当 OpenTelemetry 遇上阿里云 Prometheus

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

新场景、新能力，AI-native 时代的可观测革新

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

利用CEN-TR实现企业级云上网络架构最佳实践

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

监控vLLM等大模型推理性能

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

当 OpenTelemetry 遇上阿里云 Prometheus

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

新场景、新能力，AI-native 时代的可观测革新

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

利用CEN-TR实现企业级云上网络架构最佳实践