官方博客-第9页-阿里云开发者社区

赵世振

2024-12-24

1274

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,274

ModelScope

2025-06-16

535

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

535

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43715

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,715

望宸

2025-02-28

1081

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,081

悦达

2025-03-21

1137

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,137

阿里云云原生

2025-08-26

494

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云速搭 CADT（Cloud Architect Design Tools）推出智能化升级——云小搭，一款基于大模型的 AI 云架构助手，致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。

阿里云云原生

494

刘佳旭

2023-09-26

138992

云原生场景下高可用架构的最佳实践

刘佳旭

138,992

阿里云存储

2024-05-15

140387

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

140,387

寒斜

2024-06-24

36505

AI 克隆声音，只需 3 分钟（附最全教程）

文章介绍了GPT-Sovits，一个开源的生成式语音模型，因其在声音克隆上的高质量和简易性而受到关注。阿里云函数计算（Function Compute）提供了一个快速托管GPT-Sovits的方法，让用户无需管理服务器即可体验和部署该模型。通过函数计算，用户可以便捷地搭建基于GPT-Sovits的文本到语音服务，并享受到按需付费和弹性扩展的云服务优势。此外，文章还列举了GPT-Sovits在教育、游戏、新能源等多个领域的应用场景，并提供了详细的步骤指导，帮助用户在阿里云上部署和体验GPT-Sovits模型。

寒斜

36,505

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

大模型推理主战场：通信协议的标配

监控vLLM等大模型推理性能

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

云原生场景下高可用架构的最佳实践

用软硬协同设计下的飞天盘古降低存储系统开销

AI 克隆声音，只需 3 分钟（附最全教程）

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

大模型推理主战场：通信协议的标配

监控vLLM等大模型推理性能

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

云原生场景下高可用架构的最佳实践

用软硬协同设计下的飞天盘古降低存储系统开销

AI 克隆声音，只需 3 分钟（附最全教程）