官方博客-第21页-阿里云开发者社区

亦达

2025-02-20

729

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

729

望雲十雨言澈

2025-04-10

568

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

568

阿里云云原生

2025-06-24

559

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码现已全面支持Qwen3，新增智能体模式，具备自主决策、环境感知、工具使用等能力，可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换，结合MCP工具与记忆功能，提升开发效率。AI IDE重构编程流程，让开发更智能高效。

阿里云云原生

559

田双坤禹杨杨孙健翔

2024-05-15

101797

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,797

探索云世界

2024-05-15

40629

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

幻兽帕鲁最近非常火。有些小伙伴可能不喜欢跟陌生人一起玩，那么你可以搭建一个专有服务器和朋友一起联机游戏。自己搭建服务器不仅更私密，还能自定义游戏里的一些选项，比如调整工作速度倍率、经验获取倍率等。这篇教程将引导你在几分钟内快速完成幻兽帕鲁服务器的搭建。

探索云世界

40,629

斜阳

2024-05-15

133400

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,400

杨永

2024-05-15

93884

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,884

景祁

2024-05-15

164512

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目，如果您正在推进企业云原生 FinOps 落地，除了选择合适的技术手段，企业内部的流程和体系建设也尤为重要。

景祁

164,512

剑洁雲尧

2024-09-04

633

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

633

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

使用KMS为MSE-Nacos敏感配置加密的最佳实践

设计与构建 FinOps 流程、团队、体系与目标

浅谈Elasticsearch的入门与实践

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

使用KMS为MSE-Nacos敏感配置加密的最佳实践

设计与构建 FinOps 流程、团队、体系与目标

浅谈Elasticsearch的入门与实践