官方博客-第13页-阿里云开发者社区

ModelScope

2024-05-15

1152

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,152

新念

2025-02-14

1431

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,431

丕天

2025-03-21

1129

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,129

阿里云开发者

2025-04-24

1158

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,158

ModelScope

2024-05-15

2592

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,592

ModelScope

2024-05-15

1948

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,948

雨鸦

2024-12-27

1549

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,549

阿里云云原生

2025-08-26

496

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

阿里云云速搭 CADT（Cloud Architect Design Tools）推出智能化升级——云小搭，一款基于大模型的 AI 云架构助手，致力于让每一位用户都能“动动嘴”就完成专业级云架构设计。

阿里云云原生

496

阿里云云原生

2024-05-15

63343

All in One：Prometheus 多实例数据统一管理最佳实践

当管理多个Prometheus实例时，阿里云Prometheus托管版相比社区版提供了更可靠的数据采集和便捷的管理。本文比较了全局聚合实例与数据投递方案，两者在不同场景下各有优劣。

阿里云云原生

63,343

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

DeepSeek-V3 高效训练关键技术分析

AI 推理场景的痛点和解决方案

为什么一定要做Agent智能体？

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

极简开发，极速上线：构建端到端大模型应用

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

All in One：Prometheus 多实例数据统一管理最佳实践

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

DeepSeek-V3 高效训练关键技术分析

AI 推理场景的痛点和解决方案

为什么一定要做Agent智能体？

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

极简开发，极速上线：构建端到端大模型应用

云速搭 AI 助理发布：对话式生成可部署的阿里云架构图

All in One：Prometheus 多实例数据统一管理最佳实践