官方博客-第26页-阿里云开发者社区

望雲十雨言澈

2025-04-10

533

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

533

恶来

2023-05-15

7448

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,448

致问

2023-09-15

120018

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,018

元毅

2024-05-15

724

解密最受欢迎的开源 Serverless 框架：流量篇

元毅

724

隆基

2024-05-15

79468

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

本文技术理念的层面了解一下事件驱动的概念。RocketMQ 5.0 在面向云时代的事件驱动架构新推出的子产品 EventBridge，最后再结合几个具体的案例帮助大家了解云时代的事件驱动方案。

隆基

79,468

ModelScope

2024-05-15

3515

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,515

阿里云大数据Al技术

2024-05-15

145451

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,451

郑嘉扬何杉

2024-05-15

59018

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

享道出行利用阿里云容器服务ACK，结合AHPA智能弹性与ECS、ECI混合部署，解决了业务潮汐效应带来的弹性滞后和成本问题。

郑嘉扬何杉

59,018

ModelScope

2024-05-15

1131

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,131

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

消息队列之 MetaQ 和 Kafka 区别和优势详解

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

解密最受欢迎的开源 Serverless 框架：流量篇

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

vLLM部署Yuan2.0：高吞吐、更便捷

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

消息队列之 MetaQ 和 Kafka 区别和优势详解

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

解密最受欢迎的开源 Serverless 框架：流量篇

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

享道出行：容器弹性技术驱动下的智慧出行稳定性实践

vLLM部署Yuan2.0：高吞吐、更便捷