官方博客-第34页-阿里云开发者社区

亦达

2025-02-20

799

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

799

阿里云实时计算Flink

2023-04-13

1313

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

1,313

别梦

2023-08-07

675

MaxCompute ODPS 重装上阵，QUALIFY

MaxCompute支持QUALIFY语法过滤Window函数的结果，使得查询语句更简洁易理解。Window函数和QUALIFY语法之间的关系可以类比聚合函数+GROUP BY语法和HAVING语法。

别梦

675

阿里云中间件

2023-08-25

547

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

阿里云中间件

547

兆维

2023-08-31

636

为什么 Higress 是 Knative 入口网关的最佳实践

Knative Serving 是一款基于 K8s 的 Serverless 开源平台，用于构建和管理现代化、可拓展、流量驱动、无服务器的应用程序。本文重点关注 Knative 网络层能力的实现。

兆维

636

之卫

2024-05-15

631

Nacos 在云原生架构下的演进

之卫

631

杨磊

2024-05-15

262801

青团社：亿级灵活用工平台的云原生架构实践

青团社是国内领先的一站式灵活用工招聘服务企业，灵活用工行业的 Top1。青团社于 2013 年在杭州成立，业务已经覆盖全国，在行业深耕 10 年。我的分享将分为以下三部分：青团社架构演进的历程、青团社如何实现云原生、总结与展望。

杨磊

262,801

王骜

2024-05-15

165276

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

165,276

隆基

2024-05-15

109357

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

109,357

官方博客-第34页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

海量数据实时分析引擎 Apache Flink

MaxCompute ODPS 重装上阵，QUALIFY

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

为什么 Higress 是 Knative 入口网关的最佳实践

Nacos 在云原生架构下的演进

青团社：亿级灵活用工平台的云原生架构实践

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

官方博客-第34页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

海量数据实时分析引擎 Apache Flink

MaxCompute ODPS 重装上阵，QUALIFY

充换电企业开迈斯低成本提升线上应用稳定性的最佳实践

为什么 Higress 是 Knative 入口网关的最佳实践

Nacos 在云原生架构下的演进

青团社：亿级灵活用工平台的云原生架构实践

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？