官方博客-第15页-阿里云开发者社区

ModelScope

2024-05-15

1187

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,187

宝惜

2024-11-15

516

架构师的真内核

本文旨在帮助大家深入理解技术、架构和团队领导力的本质，从而获得持续成长的方法。欢迎在文末留言，你觉得架构师需要具备的核心能力是什么？

宝惜

516

望宸

2025-02-20

687

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

687

言澈

2025-02-28

1217

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,217

弃余

2023-08-11

1561

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,561

张昕东

2024-07-25

14088

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,088

昱临

2024-11-14

1094

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,094

丕天

2025-03-21

1177

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,177

王晨

2025-04-03

853

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

853

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

架构师的真内核

大模型推理服务全景图

进行GPU算力管理

Linux 内存管理新特性：Memory folios 解读

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

AI 推理场景的痛点和解决方案

大模型上下文协议 MCP 带来了哪些货币化机会

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

架构师的真内核

大模型推理服务全景图

进行GPU算力管理

Linux 内存管理新特性：Memory folios 解读

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

AI 推理场景的痛点和解决方案

大模型上下文协议 MCP 带来了哪些货币化机会

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结