官方博客-第21页-阿里云开发者社区

亦达

2025-02-20

747

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

747

柯灵

2025-03-11

1602

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,602

丕天

2025-03-21

1174

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,174

望宸魁宇

2025-04-07

441

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

441

韩述

2023-09-13

2632

AnalyticDB PostgreSQL构建一站式实时数仓实践

本文介绍通过 AnalyticDB PostgreSQL 版基于实时物化视图，构建流批一体的一站式实时数仓解决方案，实现一套系统、一份数据、一次写入，即可在数仓内完成实时数据源头导入到实时分析全流程。

韩述

2,632

致问

2023-09-15

120046

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,046

阿里云PolarDB

2023-12-01

2177

[重磅更新]PolarDB-X V2.3 集中式和分布式一体化开源发布

2023年云栖大会，PolarDB-X 正式发布 2.3.0版本，重点推出PolarDB-X标准版（集中式形态），将PolarDB-X分布式中的DN节点提供单独服务，支持paxos协议的多副本模式、lizard分布式事务引擎，可以100%兼容MySQL。同时在性能场景上，采用生产级部署和参数(开启双1 + Paxos多副本强同步)，相比于开源MySQL 8.0.34，PolarDB-X在读写混合场景上有30~40%的性能提升，可以作为开源MySQL的最佳替代选择。

阿里云PolarDB

2,177

桦雄

2024-05-15

133480

走进RDS之MySQL内存分配与管理（上）

MySQL的内存分配、使用、管理的模块较多，本篇文章主要介绍InnoDB层和SQL层内存分配管理器，主要包括ut_allocator、mem_heap_allocator和MEM_ROOT，代码版本主要基于8.0.25。

桦雄

133,480

资源编排ROS

2024-05-15

483

计算巢AppFlow-如何在钉钉群实现智能答疑

随着大模型能力越来越强大，利用大语言模型进行智能答疑已经成为了一个非常普遍和常见的场景。然而，各个产品或业务方要能够准确有效地进行答疑，仅依靠大模型的通用能力是远远不够的，这时候利用私有领域FAQ文档进行大模型的检索增强生成往往可以有效解决上述问题。

资源编排ROS

483

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

AnalyticDB PostgreSQL构建一站式实时数仓实践

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

[重磅更新]PolarDB-X V2.3 集中式和分布式一体化开源发布

走进RDS之MySQL内存分配与管理（上）

计算巢AppFlow-如何在钉钉群实现智能答疑

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

AI 推理场景的痛点和解决方案

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

AnalyticDB PostgreSQL构建一站式实时数仓实践

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

[重磅更新]PolarDB-X V2.3 集中式和分布式一体化开源发布

走进RDS之MySQL内存分配与管理（上）

计算巢AppFlow-如何在钉钉群实现智能答疑