官方博客-第34页-阿里云开发者社区

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

阿里云云原生

2025-05-19

583

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

Higress MCP Server 新增了 API 认证功能，为 AI 连接提供安全保障。主要更新包括：1) 客户端到 MCP Server 的认证，支持 Key Auth、JWT Auth 和 OAuth2；2) MCP Server 到后端 API 的认证，增强第二阶段的安全性。新增功能如可重用认证方案、工具特定后端认证、透明凭证透传及灵活凭证管理，确保安全集成更多后端服务。通过 openapi-to-mcp 工具简化配置，减少手动工作量。企业版提供更高可用性保障，详情参见文档链接。

阿里云云原生

583

阿里云云原生

2025-05-23

537

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

537

孟威

2024-05-15

105520

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,520

ModelScope

2024-05-15

925

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

925

探索云世界

2024-05-15

569

一天完成基于Serverless架构的头像漫画风处理小程序

我一直都想要有一个漫画版的头像，奈何手太笨，用了很多软件 “捏不出来”，所以就在想着，是否可以基于 AI 实现这样一个功能，并部署到 Serverless 架构上让更多人来尝试使用呢。

探索云世界

569

阿里云云原生

2024-05-21

57448

函数计算助力领健信息为“看牙”注入 AI 活力

口腔治疗+函数计算=效率提升🚀 领健作为业界领先的口腔机构，面向口腔诊所提供正畸算法，但早期的算法部署遇到较多问题，因此在对比了阿里云的多个云产品之后，最终选择了函数计算。通过将 GPU 计算负载放到函数计算，领健技术团队达到了很好的降本效果，相比早前的按月持有 GPU 资源，函数计算的费用降低了 90% 左右，并大大提升了使用体验，实现了前所未有的敏捷性和效率。

阿里云云原生

57,448

陈浩章颖强

2024-05-29

55704

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,704

茏城

2024-06-28

1472

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

1,472

官方博客-第34页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

SLS 大模型可观测&安全推理审计标准解决方案

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

一天完成基于Serverless架构的头像漫画风处理小程序

函数计算助力领健信息为“看牙”注入 AI 活力

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

深度｜大模型时代下，基于湖仓一体的数据智能新范式

官方博客-第34页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Higress MCP Server 安全再升级：API 认证为 AI 连接保驾护航

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

SLS 大模型可观测&安全推理审计标准解决方案

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

一天完成基于Serverless架构的头像漫画风处理小程序

函数计算助力领健信息为“看牙”注入 AI 活力

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

深度｜大模型时代下，基于湖仓一体的数据智能新范式