官方博客-第9页-阿里云开发者社区

砚染

2024-09-03

1628

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,628

望宸

2025-02-07

870

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

870

隆基

2024-05-15

142882

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

142,882

ModelScope

2024-05-15

3611

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

通义千问团队推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。

ModelScope

3,611

雨鸦

2024-12-27

1610

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,610

阿里云大数据Al技术

2025-07-18

913

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

阿里云大数据Al技术

913

探索云世界

2025-08-05

882

Qwen-MT：翻得快，译得巧

今天，机器翻译模型Qwen-MT正式上线，支持92种语言互译，具备高度可控性与低延迟、低成本特点，适用于多种场景。开发者可通过Qwen API体验其强大翻译能力。

探索云世界

882

子白

2024-05-15

102502

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,502

骐迹

2024-05-15

1835

随着企业客户上云的深入，越来越多的客户会选择在阿里云全球region多地部署其企业业务系统，以便其全球化业务的迅速开展。阿里云在云上有非常丰富云网络产品，来协助企业客户在全球region迅速构建云上多个地域的互联互通，帮忙企业客户快速实现业务上线。本章节为您介绍如何使用云企业网转发路由器CEN-TR（Transit Router），来实现客户本地多个不同城市数据中心IDC（Internet Data Center）和云上VPC跨地域互通互联。

骐迹

1,835

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

速成RAG+Agent框架大模型应用搭建

浏览量超 10w 的热图，描述 RAG 的主流架构

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

极简开发，极速上线：构建端到端大模型应用

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

Qwen-MT：翻得快，译得巧

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云全球跨地域网络互通方案

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

速成RAG+Agent框架大模型应用搭建

浏览量超 10w 的热图，描述 RAG 的主流架构

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

Qwen1.5-MoE开源，魔搭社区推理训练最佳实践教程来啦

极简开发，极速上线：构建端到端大模型应用

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

Qwen-MT：翻得快，译得巧

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云全球跨地域网络互通方案