官方博客-第16页-阿里云开发者社区

望雲十雨言澈

2025-04-10

527

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

527

阿里云云原生

2025-05-23

536

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

536

寒斜

2021-12-29

1196

关于函数计算异步调用异常的处理方法

介绍一下如何处理异步调用函数异常的问题

寒斜

1,196

ModelScope

2024-05-15

924

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

924

阿里云云原生

2024-08-12

465

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

465

阿里云云原生

2025-01-22

510

两步构建 AI 总结助手，实现智能文档摘要

本方案将运用函数计算 FC，构建一套高可用性的 Web 服务，以满足用户多样化的需求。当用户发起请求时，系统内部会自动将包含文本和提示词的信息传递给百炼模型服务，百炼平台将根据后台配置调用相应的大模型服务，对文本数据进行智能识别与解析，最终将总结结果返回给用户。

阿里云云原生

510

阿里云云原生

2025-01-24

771

智能理解 PPT 内容，快速生成讲解视频

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

阿里云云原生

771

叶枫

2025-02-06

466

详解智能编码在前端研发的创新应用

接下来，人与智能体的交互将变得更为紧密，比如 N 年以后是否可以逐渐过渡。这个逐渐过渡的过程实际上是温和的，从依赖人类到依赖超大规模算力的转变，可能会取代我们的一些职责。这不仅仅是简单的叠加关系。对于AI和超大规模算力，这是否意味着我们可以大幅度提升软件质量，是否可以缩短研发周期并提高效率，还有创造出更优质的软件并持续发展，这无疑是肯定的。

叶枫

466

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

关于函数计算异步调用异常的处理方法

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

5 大场景上手通义灵码企业知识库 RAG

两步构建 AI 总结助手，实现智能文档摘要

智能理解 PPT 内容，快速生成讲解视频

详解智能编码在前端研发的创新应用

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

关于函数计算异步调用异常的处理方法

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

5 大场景上手通义灵码企业知识库 RAG

两步构建 AI 总结助手，实现智能文档摘要

智能理解 PPT 内容，快速生成讲解视频

详解智能编码在前端研发的创新应用

破解 vLLM + DeepSeek 规模化部署的“不可能三角”