官方博客-第24页-阿里云开发者社区

望雲十雨言澈

2025-04-10

533

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

533

恶来

2023-05-15

7448

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,448

致问

2023-09-15

120018

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,018

ModelScope

2024-05-15

1445

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B，可在魔搭体验

ModelScope

1,445

隆基

2024-05-15

79468

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

本文技术理念的层面了解一下事件驱动的概念。RocketMQ 5.0 在面向云时代的事件驱动架构新推出的子产品 EventBridge，最后再结合几个具体的案例帮助大家了解云时代的事件驱动方案。

隆基

79,468

ModelScope

2024-05-15

3515

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,515

阿里云大数据Al技术

2024-05-15

145451

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,451

ModelScope

2024-05-15

1131

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,131

澄潭董艺荃

2024-05-16

88527

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,527

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

消息队列之 MetaQ 和 Kafka 区别和优势详解

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

消息队列之 MetaQ 和 Kafka 区别和优势详解

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

深度剖析 RocketMQ 5.0，事件驱动：云时代的事件驱动有啥不同？

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚