官方博客-第14页-阿里云开发者社区

望宸

2025-02-20

658

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

658

望雲十雨言澈

2025-04-10

553

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

553

阿里云云原生

2025-05-23

557

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

557

明巍临城水德

2024-11-14

530

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

530

阿里云云原生

2025-06-30

425

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

425

阿里云云原生

2025-08-07

356

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

在 AI 与云原生融合的趋势下，开发者面临模型协同与云端扩展的挑战。MCP（模型上下文协议）提供统一的交互规范，简化模型集成与服务开发。Function AI 支持 MCP 代码一键上云，提供绑定代码仓库、OSS 上传、本地交付物部署及镜像部署等多种构建方式，助力开发者高效部署智能服务，实现快速迭代与云端协同。

阿里云云原生

356

ModelScope

2024-05-15

943

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

943

ModelScope

2024-05-15

1945

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,945

徽泠

2024-06-27

34061

基于阿里云 OpenAPI 插件，让 Grafana 轻松实现云上数据可视化

本文旨在提供一个指导性的框架，帮助用户了解插件的安装、配置以及探索如何通过 Grafana 内的阿里云 OpenAPI 插件来对云上数据进行可视化和快速验证开发原型，加强数据可视化和云监控能力，助力开发速度。

徽泠

34,061

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

AI Infra之模型显存管理分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

基于阿里云 OpenAPI 插件，让 Grafana 轻松实现云上数据可视化

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

AI Infra之模型显存管理分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

基于阿里云 OpenAPI 插件，让 Grafana 轻松实现云上数据可视化

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理