官方博客-第15页-阿里云开发者社区

澄潭计缘望宸

2025-03-14

1169

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,169

丕天

2025-03-21

1301

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,301

壬云

2025-05-29

1547

MCP进阶：一键批量搞定MCP工具部署

本文介绍了一种基于阿里云计算巢的一站式MCP工具解决方案，解决了传统MCP工具集成中的效率低下、调用方式割裂和动态管理困难等问题。方案通过标准化协议实现多MCP工具批量部署，提高云资源利用率，并支持OpenAPI与MCP双通道调用，使主流AI助手如Dify、Cherry Studio等无缝接入。内容涵盖背景、原理剖析、部署使用实战及问题排查，最后强调MCP协议作为“通用语言”连接数字与物理世界的重要性。

壬云

1,547

阿里云云原生

805

Dify 开发者必看：如何破解 MCP 集成与 Prompt 迭代难题？

Dify 是面向 AI 时代的开源大语言模型应用开发平台，GitHub Star 数超 10 万，为 LLMOps 领域增长最快项目之一。然而其在 MCP 协议集成、Prompt 敏捷调整及运维配置管理上存在短板。Nacos 3.0 作为阿里巴巴开源的注册配置中心，升级支持 MCP 动态管理、Prompt 实时变更与 Dify 环境变量托管，显著提升 Dify 应用的灵活性与运维效率。通过 Nacos，Dify 可动态发现 MCP 服务、按需路由调用，实现 Prompt 无感更新和配置白屏化运维，大幅降低 AI 应用开发门槛与复杂度。

阿里云云原生

805

阿里云云原生

2025-08-01

1153

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

1,153

探索云世界

2025-11-17

251

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开，逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇，MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破。注：客户背景为东南亚头部科技集团，文中用 GoTerra 表示。

探索云世界

251

ModelScope

2024-05-15

1997

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,997

ModelScope

2024-05-15

898

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

898

言澈

2025-02-28

1311

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,311

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI 推理场景的痛点和解决方案

MCP进阶：一键批量搞定MCP工具部署

Dify 开发者必看：如何破解 MCP 集成与 Prompt 迭代难题？

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

进行GPU算力管理

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI 推理场景的痛点和解决方案

MCP进阶：一键批量搞定MCP工具部署

Dify 开发者必看：如何破解 MCP 集成与 Prompt 迭代难题？

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

Multi-Agent实践第7期：智能体的高效协作

联合XTuner，魔搭社区全面支持数据集的长文本训练

进行GPU算力管理