官方博客-第16页-阿里云开发者社区

柯灵

2025-03-11

1601

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,601

丕天

2025-03-21

1174

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,174

杨永

2024-05-15

93899

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,899

ModelScope

2024-05-15

1894

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,894

ModelScope

2024-05-15

1182

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,182

龙蜥社区OpenAnolis

2024-11-06

775

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

775

易定

2024-12-06

1061

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,061

荣阳

2025-02-28

1060

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,060

望雲十雨言澈

2025-04-10

583

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

583

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

使用KMS为MSE-Nacos敏感配置加密的最佳实践

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

【实战干货】AI大模型工程应用于车联网场景的实战总结

使用A10单卡24G复现DeepSeek R1强化学习过程

AI Infra之模型显存管理分析

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

使用KMS为MSE-Nacos敏感配置加密的最佳实践

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

【实战干货】AI大模型工程应用于车联网场景的实战总结

使用A10单卡24G复现DeepSeek R1强化学习过程

AI Infra之模型显存管理分析