官方博客-第11页-阿里云开发者社区

ModelScope

2024-05-15

1166

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,166

阿里云云原生

2024-05-16

57082

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,082

阿里云云原生

2024-05-24

47982

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

使用阿里云函数计算FC，快速部署AI绘画工具ComfyUI，体验高质量图像生成。新用户可享180元试用额度，包括GPU、vCPU、内存和调用次数。开通FC和文件存储NAS，通过应用中心选择ComfyUI模板创建应用。

阿里云云原生

47,982

赵世振

2024-12-24

1301

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,301

ModelScope

2024-05-15

1223

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,223

阿里云云原生

2025-06-03

1096

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,096

ModelScope

2024-05-15

2604

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,604

阿里云云原生

2024-05-15

63362

All in One：Prometheus 多实例数据统一管理最佳实践

当管理多个Prometheus实例时，阿里云Prometheus托管版相比社区版提供了更可靠的数据采集和便捷的管理。本文比较了全局聚合实例与数据投递方案，两者在不同场景下各有优劣。

阿里云云原生

63,362

寒斜

2024-06-24

36532

文章介绍了GPT-Sovits，一个开源的生成式语音模型，因其在声音克隆上的高质量和简易性而受到关注。阿里云函数计算（Function Compute）提供了一个快速托管GPT-Sovits的方法，让用户无需管理服务器即可体验和部署该模型。通过函数计算，用户可以便捷地搭建基于GPT-Sovits的文本到语音服务，并享受到按需付费和弹性扩展的云服务优势。此外，文章还列举了GPT-Sovits在教育、游戏、新能源等多个领域的应用场景，并提供了详细的步骤指导，帮助用户在阿里云上部署和体验GPT-Sovits模型。

寒斜

36,532

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

元象大模型开源30款量化版本加速低成本部署丨附教程

实现企业级 MCP 服务统一管理和智能检索的实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

All in One：Prometheus 多实例数据统一管理最佳实践

AI 克隆声音，只需 3 分钟（附最全教程）

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

“黏土风格”轻松拿捏，基于函数计算部署 ComfyUI实现AI生图

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

元象大模型开源30款量化版本 加速低成本部署丨附教程

实现企业级 MCP 服务统一管理和智能检索的实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

All in One：Prometheus 多实例数据统一管理最佳实践

AI 克隆声音，只需 3 分钟（附最全教程）

元象大模型开源30款量化版本加速低成本部署丨附教程