官方博客-第14页-阿里云开发者社区

亦达

2025-02-20

648

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

648

任庆盛

2023-02-22

23073

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师，Apache Flink Committer 任庆盛，在 9 月 24 日 Apache Flink Meetup 的分享。

任庆盛

23,073

ModelScope

2024-05-15

109937

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

109,937

砚染

2024-09-03

1369

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,369

阿里云云原生

2025-02-19

415

一键构建智能导购 AI 助手，轻松重塑购物体验

在数字化时代，线上购物已成为消费者生活中不可或缺的消费方式，而消费者的购物习惯和需求逐渐呈现多样化的趋势，为了帮助商家全天候、自动化地满足顾客的购物需求，本方案将详细介绍如何基于商品内容构建一个智能商品导购助手。

阿里云云原生

415

刘佳旭

2023-09-26

138864

云原生场景下高可用架构的最佳实践

刘佳旭

138,864

扬流

2024-05-15

119001

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,001

子丑雅纯

2024-05-15

123368

提升团队工程交付能力，从“看见”工程活动和研发模式开始

本文从统一工程交付的概念模型开始，介绍了如何将应用交付的模式显式地定义出来，并通过工具平台落地。

子丑雅纯

123,368

阿里云云原生

2024-09-14

491

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

本⽂对敏感信息拦截插件的使用方式和实现原理进行了简单介绍，它能够自动检测并处理请求和响应中的敏感词，有效防止敏感信息泄露。通过对不同数据范围的支持和灵活的配置选项，该插件能够适应各种应用场景，确保数据的安全性和合规性。

阿里云云原生

491

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Flink CDC+Kafka 加速业务实时化

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

速成RAG+Agent框架大模型应用搭建

一键构建智能导购 AI 助手，轻松重塑购物体验

云原生场景下高可用架构的最佳实践

Paimon 与 Spark 的集成（二）：查询优化

提升团队工程交付能力，从“看见”工程活动和研发模式开始

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Flink CDC+Kafka 加速业务实时化

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

速成RAG+Agent框架大模型应用搭建

一键构建智能导购 AI 助手，轻松重塑购物体验

云原生场景下高可用架构的最佳实践

Paimon 与 Spark 的集成（二）：查询优化

提升团队工程交付能力，从“看见”工程活动和研发模式开始

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力