官方博客-第15页-阿里云开发者社区

阿里云云原生

2025-06-30

529

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

529

王明橙鲤黄俊

2024-05-15

64202

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,202

裘展

2024-11-07

1769

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,769

言澈

2025-02-28

1302

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,302

王晨

2025-04-03

955

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

955

阿里云云原生

2025-08-26

617

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云速搭 CADT（Cloud Architect Design Tools）推出智能化升级——云小搭，一款基于大模型的 AI 云架构助手，致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。

阿里云云原生

617

阿里云大数据Al技术

2024-08-09

9243

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,243

阿里云开发者

2025-03-27

283

利用DeepSeek帮我做金融理财

本篇文章将介绍如何搭建一套基于 XXL-JOB + Deepseek 的定时数据分析系统，帮你做一个智能的金融理财助手。

阿里云开发者

283

阿里云云原生

2025-05-06

918

通过 MCP 构建企业级数据分析 Agent

本文介绍了使用阿里云实时数仓 Hologres、函数计算 FC 和通义大模型 Qwen3 构建企业级数据分析 Agent 的方法。通过 MCP（模型上下文协议）标准化接口，解决大模型与外部工具和数据源集成的难题。Hologres 提供高性能数据分析能力，支持实时数据接入和湖仓一体分析；函数计算 FC 提供弹性、安全的 Serverless 运行环境；Qwen3 具备强大的多语言处理和推理能力。方案结合 ModelScope 的 MCP Playground，实现高效的服务化部署，帮助企业快速构建跨数据源、多步骤分解的数据分析 Agent，优化数据分析流程并降低成本。

阿里云云原生

918

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

通义千问开源模型在PAI灵骏的最佳实践

白话文讲解大模型｜ Attention is all you need

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

基于RAG搭建企业级知识库在线问答

利用DeepSeek帮我做金融理财

通过 MCP 构建企业级数据分析 Agent

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

通义千问开源模型在PAI灵骏的最佳实践

白话文讲解大模型｜ Attention is all you need

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

基于RAG搭建企业级知识库在线问答

利用DeepSeek帮我做金融理财

通过 MCP 构建企业级数据分析 Agent