官方博客-第10页-阿里云开发者社区

丕天

2025-03-21

1138

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,138

悦达

2025-03-21

1151

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,151

大模型服务小助手

2025-07-01

1164

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

本文介绍如何利用智能体与Python代码批量处理Excel中的脏数据，解决人工录入导致的格式混乱、逻辑错误等问题。通过构建具备数据校验、异常标记及自动修正功能的系统，将数小时的人工核查任务缩短至分钟级，大幅提升数据一致性和办公效率。

大模型服务小助手

1,164

阿里云云原生

2024-05-15

93579

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测为切入点，对比 OpenTelemetry 与 Prometheus 的相同与差异，重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

阿里云云原生

93,579

阿里云云原生

2024-05-16

57063

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,063

赵世振

2024-12-24

2547

本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成，适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务，文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术，并通过对比实验展示了优化效果。优化后，机器负载降低，任务耗时减少，网络负载更优。同时，文章还提供了异常处理方法及常见问题解决方案，帮助开发者更好地集成和使用SDK。

赵世振

2,547

望宸

2025-02-28

1087

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,087

ant-ray项目组

2025-04-11

1152

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,152

阿里云大数据Al技术

2025-07-28

1447

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,447

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

AI 推理场景的痛点和解决方案

监控vLLM等大模型推理性能

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

当 OpenTelemetry 遇上阿里云 Prometheus

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

【最佳实践系列】高并发调用百炼语音合成大模型

大模型推理主战场：通信协议的标配

AI开源框架：让分布式系统调试不再"黑盒"

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI 推理场景的痛点和解决方案

监控vLLM等大模型推理性能

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

当 OpenTelemetry 遇上阿里云 Prometheus

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

【最佳实践系列】高并发调用百炼语音合成大模型

大模型推理主战场：通信协议的标配

AI开源框架：让分布式系统调试不再"黑盒"

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型