官方博客-第27页-阿里云开发者社区

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

阿里云云原生

2025-05-19

583

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

Higress MCP Server 新增了 API 认证功能，为 AI 连接提供安全保障。主要更新包括：1) 客户端到 MCP Server 的认证，支持 Key Auth、JWT Auth 和 OAuth2；2) MCP Server 到后端 API 的认证，增强第二阶段的安全性。新增功能如可重用认证方案、工具特定后端认证、透明凭证透传及灵活凭证管理，确保安全集成更多后端服务。通过 openapi-to-mcp 工具简化配置，减少手动工作量。企业版提供更高可用性保障，详情参见文档链接。

阿里云云原生

583

阿里云云原生

2025-05-23

537

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

537

欧叔

2024-05-15

135854

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

本文为阿里云智能媒体服务IMS「云端智能剪辑」实践指南第6期，从客户真实实践场景出发，分享一些Timeline小技巧（AI_TTS、主轨道、素材对齐），助力客户降低开发时间与成本。

欧叔

135,854

ModelScope

2024-05-15

925

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

925

ModelScope

2024-05-15

3513

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,513

阿里云云原生

2024-05-15

410

实践总结｜前端架构设计的一点考究（下）

作者将【DDD、六边形、洋葱、清洁、CQRS】进行深入学习并梳理总结的一个前端架构设计，并且经历一定应用实践的考验。

阿里云云原生

410

陈浩章颖强

2024-05-29

55704

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,704

茏城

2024-06-28

1472

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

1,472

官方博客-第27页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

实践总结｜前端架构设计的一点考究（下）

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

深度｜大模型时代下，基于湖仓一体的数据智能新范式

官方博客-第27页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于客户真实使用场景的云剪辑Timeline问题解答与代码实操

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

实践总结｜前端架构设计的一点考究（下）

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

深度｜大模型时代下，基于湖仓一体的数据智能新范式