官方博客-第14页-阿里云开发者社区

阿里云云原生

2025-08-07

352

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

在 AI 与云原生融合的趋势下，开发者面临模型协同与云端扩展的挑战。MCP（模型上下文协议）提供统一的交互规范，简化模型集成与服务开发。Function AI 支持 MCP 代码一键上云，提供绑定代码仓库、OSS 上传、本地交付物部署及镜像部署等多种构建方式，助力开发者高效部署智能服务，实现快速迭代与云端协同。

阿里云云原生

352

阿里云云原生

2024-05-15

2466

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,466

子白

2024-05-15

102437

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,437

ModelScope

2024-05-15

3530

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,530

山泽

2024-05-15

1314

从零构建现代深度学习框架(TinyDL-0.01)

本文主要以一个Java工程师视角，阐述如何从零(无任何二三方依赖)构建一个极简(麻雀虽小五脏俱全)现代深度学习框架（类比AI的操作系统）。

山泽

1,314

澄潭计缘望宸

2025-03-14

977

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

977

望雲十雨言澈

2025-04-10

544

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

544

阿里云实时数仓Hologres

2024-06-18

2310

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,310

阿里云实时数仓Hologres

2024-06-27

102978

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

阿里云实时数仓Hologres

102,978

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

从零构建现代深度学习框架(TinyDL-0.01)

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI Infra之模型显存管理分析

森马基于MaxCompute+Hologres+DataWorks构建数据中台

Hologres+Flink企业级实时数仓核心能力介绍

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

从零构建现代深度学习框架(TinyDL-0.01)

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI Infra之模型显存管理分析

森马基于MaxCompute+Hologres+DataWorks构建数据中台

Hologres+Flink企业级实时数仓核心能力介绍