官方博客-第6页-阿里云开发者社区

ModelScope

2025-05-23

1793

通义灵码 + 魔搭MCP：全流程构建创空间应用

最近，通义灵码上线 MCP（ModelScope Cloud Platform）功能，从之前代码生成及修改的基础功能，到可以使用MCP服务连接更多功能，开发者可以实现从代码爬取、模型推理到应用部署

ModelScope

1,793

翎薇

2025-05-22

2398

本文介绍了MCP（Model Context Protocol）与Qwen3模型的结合应用。MCP通过统一协议让AI模型连接各种工具和数据源，类似AI世界的“USB-C”接口。文中详细解析了MCP架构，包括Host、Client和Server三个核心组件，并说明了模型如何智能选择工具及工具执行反馈机制。Qwen3作为新一代通义千问模型，采用混合专家架构，具备235B参数但仅需激活22B，支持快速与深度思考模式，多语言处理能力覆盖119种语言。文章还展示了Qwen3的本地部署流程，以及开发和调试MCP Server与Client的具体步骤。

翎薇

2,398

阿里云云原生

2025-08-05

1285

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

Nacos社区推出MCP Router与MCP Registry开源解决方案，助力AI Agent高效调用外部工具。Router可智能筛选匹配的MCP Server，减少Token消耗，提升安全性与部署效率。结合Nacos Registry实现服务自动发现与管理，简化AI Agent集成复杂度。支持协议转换与容器化部署，保障服务隔离与数据安全。提供智能路由与代理模式，优化工具调用性能，助力MCP生态普及。

阿里云云原生

1,285

探索云世界

2025-11-17

436

阿里云 AI 搜索 DeepSearch 技术实践

阿里云OpenSearch LLM版推出DeepSearch技术，实现从RAG 1.0到RAG 2.0的升级。基于多智能体协同架构，支持复杂推理、多源检索与深度搜索，显著提升问答准确率，助力企业智能化升级。

探索云世界

436

望雲十雨言澈

2025-04-10

751

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

751

子潍

2025-05-22

1692

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

本文介绍了通过MCP（Model Context Protocol）结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型，配合ComfyUI生成图像，并通过小红书等社交媒体发布内容，展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server，完成从本地文件读取到生成图像再到发布的全流程。方案优势在于高可扩展性和易用性，但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战，推动MCP在更多领域落地。

子潍

1,692

米基

2024-05-15

4047

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

4,047

荣阳

2025-02-28

1373

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,373

唐殊

2024-11-01

2282

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

2,282

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

通义灵码 + 魔搭MCP：全流程构建创空间应用

多快好省，Qwen3混合部署模式引爆MCP

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

阿里云 AI 搜索 DeepSearch 技术实践

AI Infra之模型显存管理分析

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

大模型推理优化实践：KV cache复用与投机采样

使用A10单卡24G复现DeepSeek R1强化学习过程

探索LLM推理全阶段的JSON格式输出限制方法

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

通义灵码 + 魔搭MCP：全流程构建创空间应用

多快好省，Qwen3混合部署模式引爆MCP

如何实现 AI Agent 自主发现和使用 MCP 服务 —— Nacos MCP Router 部署最佳实践

阿里云 AI 搜索 DeepSearch 技术实践

AI Infra之模型显存管理分析

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

大模型推理优化实践：KV cache复用与投机采样

使用A10单卡24G复现DeepSeek R1强化学习过程

探索LLM推理全阶段的JSON格式输出限制方法