官方博客-第17页-阿里云开发者社区

亦达

2025-02-20

726

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

726

阿里云云原生

2025-05-23

569

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

569

言澈

2024-05-15

1025

全景剖析阿里云容器网络数据链路（二）—— Terway ENI

本文是[全景剖析容器网络数据链路]第二部分，主要介绍Kubernetes Terway ENI模式下，数据面链路的转转发链路。

言澈

1,025

ModelScope

2024-05-15

1138

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,138

ModelScope

2024-05-15

748

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

748

阿里云实时数仓Hologres

2024-06-18

2326

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,326

资源编排ROS

2024-07-11

476

使用资源编排 ROS 轻松部署高可用架构网站——以 WordPress 为例

WordPress 是流行的开源 CMS，阿里云的资源编排服务 (ROS) 提供 IaC 功能，简化云上资源自动化部署，如创建 VPC、ECS、SLB、RDS 和弹性伸缩等。通过 ROS 模板（JSON/YAML），用户能快速部署高可用的 WordPress 环境，包括负载均衡、多可用区的 ECS 服务器集群、高可用 RDS 数据库等。模板定义了资源、参数和输出，用户在 ROS 控制台配置参数后一键部署。ROS 提升了部署效率，便于跨地域复制相同架构。

资源编排ROS

476

灵杰开发者

2024-08-22

18005

Apache Paimon V0.9最新进展

Apache Paimon V0.9 版本即将发布，此版本带来了多项新特性并解决了关键挑战。Paimon自2022年从Flink社区诞生以来迅速成长，已成为Apache顶级项目，并广泛应用于阿里集团内外的多家企业。

灵杰开发者

18,005

喻奎

2024-08-23

304

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

304

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

全景剖析阿里云容器网络数据链路（二）—— Terway ENI

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

森马基于MaxCompute+Hologres+DataWorks构建数据中台

使用资源编排 ROS 轻松部署高可用架构网站——以 WordPress 为例

Apache Paimon V0.9最新进展

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

全景剖析阿里云容器网络数据链路（二）—— Terway ENI

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

森马基于MaxCompute+Hologres+DataWorks构建数据中台

使用资源编排 ROS 轻松部署高可用架构网站——以 WordPress 为例

Apache Paimon V0.9最新进展

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍