官方博客-第16页-阿里云开发者社区

有松

2025-01-16

452

AI 场景下，函数计算 GPU 实例模型存储最佳实践

当前，函数计算 FC 已被广泛应用在各种 AI 场景下，函数计算支持通过使用容器镜像部署 AI 推理应用，并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用，并快速解决不同场景下的模型存储选型问题，本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析，以期为您的模型存储决策提供帮助。

有松

452

澄潭计缘望宸

2025-03-14

1168

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,168

星莲

2024-11-21

1578

剖析大模型连“Strawberry”的“r”都数不对的原因

本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理，并解释了为什么会导致这些问题，接着我们利用CoT（思维链）方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因，最后提出【理由先行】风格这一简单有效的Prompt Trick。

星莲

1,578

寒斜

2024-06-24

36683

AI 克隆声音，只需 3 分钟（附最全教程）

文章介绍了GPT-Sovits，一个开源的生成式语音模型，因其在声音克隆上的高质量和简易性而受到关注。阿里云函数计算（Function Compute）提供了一个快速托管GPT-Sovits的方法，让用户无需管理服务器即可体验和部署该模型。通过函数计算，用户可以便捷地搭建基于GPT-Sovits的文本到语音服务，并享受到按需付费和弹性扩展的云服务优势。此外，文章还列举了GPT-Sovits在教育、游戏、新能源等多个领域的应用场景，并提供了详细的步骤指导，帮助用户在阿里云上部署和体验GPT-Sovits模型。

寒斜

36,683

垚佳汐遥

2024-10-23

1094

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,094

探索云世界

2025-01-02

490

云端问道11期实践教学-创建专属AI助手

本次分享意在帮助用户更加全面、深入地了解百炼的核心产品能力，并通过实际操作学会如何快速将大模型与自己的系统及应用相结合。主要包括以下三个方面： 1. 阿里云百炼产品定位和能力简介 2. 知识检索 RAG 智能体应用能力和优势 3. 最佳落地案例实践分享

探索云世界

490

阿里云云原生

2024-05-15

1000

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

本文主要介绍阿里云 Serverless 应用引擎如何帮助企业跨越技术鸿沟，从传统应用架构无感升级到 Serverless 架构，以更高效、更经济的方式进行转型，快速进入云原生快车道，让 2 人的研发团队享受 2000 人技术团队的红利。

阿里云云原生

1,000

雨鸦

2024-12-27

1737

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,737

壬云

2025-05-29

1543

MCP进阶：一键批量搞定MCP工具部署

本文介绍了一种基于阿里云计算巢的一站式MCP工具解决方案，解决了传统MCP工具集成中的效率低下、调用方式割裂和动态管理困难等问题。方案通过标准化协议实现多MCP工具批量部署，提高云资源利用率，并支持OpenAPI与MCP双通道调用，使主流AI助手如Dify、Cherry Studio等无缝接入。内容涵盖背景、原理剖析、部署使用实战及问题排查，最后强调MCP协议作为“通用语言”连接数字与物理世界的重要性。

壬云

1,543

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

AI 场景下，函数计算 GPU 实例模型存储最佳实践

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

剖析大模型连“Strawberry”的“r”都数不对的原因

AI 克隆声音，只需 3 分钟（附最全教程）

通义灵码知识库问答增强：知识库构建与管理指南

云端问道11期实践教学-创建专属AI助手

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

极简开发，极速上线：构建端到端大模型应用

MCP进阶：一键批量搞定MCP工具部署

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI 场景下，函数计算 GPU 实例模型存储最佳实践

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

剖析大模型连“Strawberry”的“r”都数不对的原因

AI 克隆声音，只需 3 分钟（附最全教程）

通义灵码知识库问答增强：知识库构建与管理指南

云端问道11期实践教学-创建专属AI助手

阿里云 SAE 2.0 正式商用，极简易用、百毫秒弹性效率，降本 40%

极简开发，极速上线：构建端到端大模型应用

MCP进阶：一键批量搞定MCP工具部署