官方博客-第22页-阿里云开发者社区

亦达

2025-02-20

711

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

711

阿里云云原生

2025-06-24

543

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码现已全面支持Qwen3，新增智能体模式，具备自主决策、环境感知、工具使用等能力，可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换，结合MCP工具与记忆功能，提升开发效率。AI IDE重构编程流程，让开发更智能高效。

阿里云云原生

543

阿里云云原生

2025-08-07

353

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

在 AI 与云原生融合的趋势下，开发者面临模型协同与云端扩展的挑战。MCP（模型上下文协议）提供统一的交互规范，简化模型集成与服务开发。Function AI 支持 MCP 代码一键上云，提供绑定代码仓库、OSS 上传、本地交付物部署及镜像部署等多种构建方式，助力开发者高效部署智能服务，实现快速迭代与云端协同。

阿里云云原生

353

勉成

2019-07-23

11655

Java 类是如何被加载的

这篇文章从双亲委派讲到了Class文件的加载，最后又绕回到双亲委派，看似有点绕，其实只有理解了Class的加载机制，才能更好的理解类似双亲委派这样的机制，否则只死记硬背一些空洞的理论，是无法起到由内而外的理解的。

勉成

11,655

阿里云网络

2023-07-12

897

阿里云飞天洛神云网络集中式网关ACMG最佳实践

云网络集中式网关ACMG的实践

阿里云网络

897

ModelScope

2024-05-15

505

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

505

阿里云云原生

2024-05-15

55711

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,711

ModelScope

2024-05-15

1143

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,143

ModelScope

2024-05-15

1124

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,124

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

Java 类是如何被加载的

阿里云飞天洛神云网络集中式网关ACMG最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Higress 全新 Wasm 运行时，性能大幅提升

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

Java 类是如何被加载的

阿里云飞天洛神云网络集中式网关ACMG最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Higress 全新 Wasm 运行时，性能大幅提升

vLLM部署Yuan2.0：高吞吐、更便捷

LISA微调技术解析：比LoRA更低的显存更快的速度