官方博客-第23页-阿里云开发者社区

亦达

2025-02-20

726

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

726

阿里云云原生

2025-05-23

569

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

569

茏久

2023-07-21

138777

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

本文从阿里云用户使用云原生数据仓库AnalyticDB PostgreSQL版（以下简称ADB PG）的实际体验出发，介绍ADB PG如何实现“一站式全文检索”业务，并详细阐述ADB PG使用的优势技术，最后提供对应业务案例分析。

茏久

138,777

周宇睿

2023-09-08

736

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

736

阿里云PolarDB

2024-05-15

96548

PolarDB-X 开源 | 基于Paxos的MySQL三副本

PolarDB-X 作为PolarDB分布式版，是阿里巴巴自主设计研发的高性能云原生分布式数据库产品，采用 Shared-nothing 与存储分离计算架构，支持集中式和分布式一体化形态，具备金融级数据高可用、分布式水平扩展、混合负载、低成本存储和极致弹性等能力，坚定以兼容MySQL开源生态构建分布式能力，为用户提供高吞吐、大存储、低延时、易扩展和超高可用的云时代数据库服务。

阿里云PolarDB

96,548

缘祺

2024-05-15

112861

浅析MySQL代价估计器

代价估计是优化其中非常重要的一个步骤，研究代价估计的原理和MySQL的具体实现对做SQL优化是非常有帮助。本文有案例有代码，由浅入深的介绍了代价估计的原理和MySQL的具体实现。

缘祺

112,861

隆基

2024-05-15

108481

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构，最后再分别从业务场景切入，详细介绍 RocketMQ 5.0 在不同的业务场景提供的能力和关键技术原理，包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

隆基

108,481

ModelScope

2024-05-15

748

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

748

资源编排ROS

2024-07-11

476

使用资源编排 ROS 轻松部署高可用架构网站——以 WordPress 为例

WordPress 是流行的开源 CMS，阿里云的资源编排服务 (ROS) 提供 IaC 功能，简化云上资源自动化部署，如创建 VPC、ECS、SLB、RDS 和弹性伸缩等。通过 ROS 模板（JSON/YAML），用户能快速部署高可用的 WordPress 环境，包括负载均衡、多可用区的 ECS 服务器集群、高可用 RDS 数据库等。模板定义了资源、参数和输出，用户在 ROS 控制台配置参数后一键部署。ROS 提升了部署效率，便于跨地域复制相同架构。

资源编排ROS

476

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

MaxCompute半结构化数据思考与创新

PolarDB-X 开源 | 基于Paxos的MySQL三副本

浅析MySQL代价估计器

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

联合XTuner，魔搭社区全面支持数据集的长文本训练

使用资源编排 ROS 轻松部署高可用架构网站——以 WordPress 为例

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

MaxCompute半结构化数据思考与创新

PolarDB-X 开源 | 基于Paxos的MySQL三副本

浅析MySQL代价估计器

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

联合XTuner，魔搭社区全面支持数据集的长文本训练

使用资源编排 ROS 轻松部署高可用架构网站——以 WordPress 为例