官方博客-第18页-阿里云开发者社区

望雲十雨言澈

2025-04-10

534

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

534

濯光翼严

2025-04-15

537

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

无论是使用 Nacos-Controller 实现配置的双向同步，还是直接在应用中接入 Nacos SDK 以获得更高级的配置管理特性，都能显著提升配置管理的灵活性、安全性和可维护性。使用 Nacos，您能够更好地管理和优化您的应用配置，从而提高系统的稳定性和可靠性。

濯光翼严

537

致问

2023-09-15

120019

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,019

阿里云大数据Al技术

2024-05-15

145453

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,453

ModelScope

2024-05-15

1369

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,369

牛俊

2024-08-15

11741

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,741

赵世振

2024-08-21

1451

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,451

才胜南也

2024-09-05

967

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

967

亦达

2025-02-20

700

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

700

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

动手实践：高效构建企业级AI搜索

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

RAG效果优化：高质量文档解析详解

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

动手实践：高效构建企业级AI搜索

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

RAG效果优化：高质量文档解析详解

破解 vLLM + DeepSeek 规模化部署的“不可能三角”