官方博客-第23页-阿里云开发者社区

望雲十雨言澈

2025-04-10

529

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

529

封崇

2025-04-16

1409

MCP 正当时：FunctionAI MCP 开发平台来了！

MCP 的价值是统一了 Agent 和 LLM 之间的标准化接口，有了 MCP Server 的托管以及开发态能力只是第一步，接下来重要的是做好 MCP 和 Agent 的集成，FunctionAI 即将上线 Agent 开发能力，敬请期待。

封崇

1,409

偏左

2023-08-28

21361

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

21,361

周宇睿

2023-09-08

714

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

714

资源编排ROS

2023-12-01

669

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括：1. 工具准备：安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备：创建工程目录，进入虚拟环境，配置阿里云凭证信息，配置ROSCDK。3. 代码编写：根据文档描述，编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码：执行ROS代码，创建ECS实例并部署FTP服务。总体来说，本文通过简单的步骤，让小白也能快速上手使用ROS资源编排服务，实现自动化部署和管理阿里云资源。

资源编排ROS

669

ModelScope

2024-05-15

924

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

924

阿里云云原生

2024-05-15

410

实践总结｜前端架构设计的一点考究（下）

作者将【DDD、六边形、洋葱、清洁、CQRS】进行深入学习并梳理总结的一个前端架构设计，并且经历一定应用实践的考验。

阿里云云原生

410

ModelScope

2024-05-15

1128

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,128

李鹏

2024-05-15

574

Serverless Kubernetes 开发实践：异构资源，按需使用

Kubernetes 作为当今云原生业界标准，具备良好的生态以及跨云厂商能力。Kubernetes 很好的抽象了 IaaS 资源交付标准，使得云资源交付变的越来越简单，与此同时用户期望更多的聚焦于业务自身，做到面向应用交付，Serverless 理念也因此而生。那么如何通过原生 k8s 提供Serverless 能力？如何实现GPU等异构资源按需使用？这里给大家介绍一下我们在Serverless Kubernetes 开发实践：异构资源，按需使用。

李鹏

574

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

MCP 正当时：FunctionAI MCP 开发平台来了！

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

MaxCompute半结构化数据思考与创新

从零开始使用 ROS CDK 搭建云上解决方案

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

实践总结｜前端架构设计的一点考究（下）

vLLM部署Yuan2.0：高吞吐、更便捷

Serverless Kubernetes 开发实践：异构资源，按需使用

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

MCP 正当时：FunctionAI MCP 开发平台来了！

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

MaxCompute半结构化数据思考与创新

从零开始使用 ROS CDK 搭建云上解决方案

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

实践总结｜前端架构设计的一点考究（下）

vLLM部署Yuan2.0：高吞吐、更便捷

Serverless Kubernetes 开发实践：异构资源，按需使用