官方博客-第18页-阿里云开发者社区

ModelScope

2024-05-15

1187

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,187

阿里云瑶池数据库

2024-05-15

71417

数据存储成本飙升，莫慌，RDS数据归档功能来了

一文解锁阿里云RDS数据归档功能。

阿里云瑶池数据库

71,417

舟谨

2024-12-13

488

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

488

言澈

2025-02-28

1217

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,217

王晨

2025-04-03

854

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

854

阿里云云原生

2025-05-19

627

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

Higress MCP Server 新增了 API 认证功能，为 AI 连接提供安全保障。主要更新包括：1) 客户端到 MCP Server 的认证，支持 Key Auth、JWT Auth 和 OAuth2；2) MCP Server 到后端 API 的认证，增强第二阶段的安全性。新增功能如可重用认证方案、工具特定后端认证、透明凭证透传及灵活凭证管理，确保安全集成更多后端服务。通过 openapi-to-mcp 工具简化配置，减少手动工作量。企业版提供更高可用性保障，详情参见文档链接。

阿里云云原生

627

弃余

2023-08-11

1561

Linux 内存管理新特性：Memory folios 解读

本文主要讲解folio ，极其在应用中的直接价值。

弃余

1,561

张昕东

2024-07-25

14088

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,088

昱临

2024-11-14

1094

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,094

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

数据存储成本飙升，莫慌，RDS数据归档功能来了

如何提取手写票据信息

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

Linux 内存管理新特性：Memory folios 解读

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

数据存储成本飙升，莫慌，RDS数据归档功能来了

如何提取手写票据信息

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

Linux 内存管理新特性：Memory folios 解读

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结