官方博客-第19页-阿里云开发者社区

ModelScope

2024-05-15

1184

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,184

数据库小助手

2024-11-19

1858

开源新发布｜PolarDB-X v2.4.1 增强企业级运维能力

PolarDB-X 是阿里云推出的云原生分布式数据库，自2021年10月开源以来，持续迭代升级，至2024年4月发布的v2.4.1版本，重点增强了企业级运维能力，如无锁变更、物理扩缩容、数据TTL等，提供金融级高可用、透明分布式、HTAP一体化等特性。PolarDB-X 支持集中式和分布式一体化形态，兼容MySQL生态，适用于金融、通信、政务等行业。

数据库小助手

1,858

易定

2024-12-06

1062

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,062

张智超

2025-02-07

484

巧用通义灵码，提升前端研发效率

本次分享，主题是利用通义灵码提升前端研发效率。分享内容主要包括以下几部分：首先，我将从前端开发的角度介绍对通义灵码的基本认识；其次，我将展示通义灵码在日常研发中的应用案例；然后，我将通过实例说明，良好的设计能够显著提升通义灵码的效果。在第四个部分，我将介绍通义灵码的企业知识库以及如何利用 RAG 构建团队智能研发助手。最后，我将总结本次分享并展望未来方向。

张智超

484

王晨

2025-04-03

850

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

850

望雲十雨言澈

2025-04-10

585

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

585

阿里云云原生

2025-06-30

443

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

443

弃余

2023-08-11

1559

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,559

桦雄

2024-05-15

133482

走进RDS之MySQL内存分配与管理（上）

MySQL的内存分配、使用、管理的模块较多，本篇文章主要介绍InnoDB层和SQL层内存分配管理器，主要包括ut_allocator、mem_heap_allocator和MEM_ROOT，代码版本主要基于8.0.25。

桦雄

133,482

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

开源新发布｜PolarDB-X v2.4.1 增强企业级运维能力

【实战干货】AI大模型工程应用于车联网场景的实战总结

巧用通义灵码，提升前端研发效率

大模型上下文协议 MCP 带来了哪些货币化机会

AI Infra之模型显存管理分析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Linux 内存管理新特性：Memory folios 解读

走进RDS之MySQL内存分配与管理（上）

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

开源新发布｜PolarDB-X v2.4.1 增强企业级运维能力

【实战干货】AI大模型工程应用于车联网场景的实战总结

巧用通义灵码，提升前端研发效率

大模型上下文协议 MCP 带来了哪些货币化机会

AI Infra之模型显存管理分析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Linux 内存管理新特性：Memory folios 解读

走进RDS之MySQL内存分配与管理（上）