官方博客-第5页-阿里云开发者社区

阿里云云原生

2025-04-29

650

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

本文介绍了阿里云Prometheus 2.0方案，针对大规模AI系统的可观测性挑战进行全面升级。内容涵盖数据采集、存储、计算、查询及生态整合等维度。 Prometheus 2.0引入自研LoongCollector实现多模态数据采集，采用全新时序存储引擎提升性能，并支持RecordingRule与ScheduleSQL预聚合计算。查询阶段提供跨区域、跨账号的统一查询能力，结合PromQL与SPL语言增强分析功能。此外，该方案已成功应用于阿里云内部AI系统，如百炼、通义千问等大模型全链路监控。未来，阿里云将发布云监控2.0产品，进一步完善智能观测技术栈。

阿里云云原生

650

徒钟

2024-05-15

189478

Apache RocketMQ ACL 2.0 全新升级

RocketMQ ACL 2.0 不管是在模型设计、可扩展性方面，还是安全性和性能方面都进行了全新的升级。旨在能够为用户提供精细化的访问控制，同时，简化权限的配置流程。欢迎大家尝试体验新版本，并应用在生产环境中。

徒钟

189,478

涯海

2025-01-17

661

链路诊断最佳实践：1 分钟定位错慢根因

本文聚焦于线上应用的风险管理，特别是针对“错”（程序运行不符合预期）和“慢”（性能低下或响应迟缓）两大类问题，提出了一个系统化的根因诊断方案。

涯海

661

枫桥

2025-02-07

488

从铜线到云端：网络技术的跨越与未来趋势

本文围绕物理网络和云网络基础知识科普进行展开，最后浅谈在AI大模型浪潮下云网络的演进方向。

枫桥

488

骆天

2024-05-15

3651

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

3,651

阿里云实时数仓Hologres

2024-06-18

2299

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,299

楠瑆

2024-12-09

523

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

阿里云 ARMS 用户体验监控（RUM）推出了针对原生鸿蒙应用的 SDK。SDK 使用 ArkTS 语言开发，支持页面采集、资源加载采集、异常采集及自定义采集等功能，能够全面监控鸿蒙应用的表现。集成简单，只需几步即可将 SDK 接入项目中，为鸿蒙应用的开发者提供了强有力的支持。

楠瑆

523

阿里云云原生

2025-01-26

1231

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,231

悦达

2025-03-21

1111

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,111

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

Apache RocketMQ ACL 2.0 全新升级

链路诊断最佳实践：1 分钟定位错慢根因

从铜线到云端：网络技术的跨越与未来趋势

高并发架构设计三大利器：缓存、限流和降级

森马基于MaxCompute+Hologres+DataWorks构建数据中台

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

最近谈论 SSE 和 WebSocket 的人越来越多的原因

监控vLLM等大模型推理性能

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

剑指大规模 AI 可观测，阿里云 Prometheus 2.0 应运而生

Apache RocketMQ ACL 2.0 全新升级

链路诊断最佳实践：1 分钟定位错慢根因

从铜线到云端：网络技术的跨越与未来趋势

高并发架构设计三大利器：缓存、限流和降级

森马基于MaxCompute+Hologres+DataWorks构建数据中台

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

最近谈论 SSE 和 WebSocket 的人越来越多的原因

监控vLLM等大模型推理性能