官方博客-第5页-阿里云开发者社区

阿里云大数据Al技术

2025-07-18

742

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

阿里云大数据Al技术

742

砚染

2024-09-03

1446

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,446

米基

2024-05-15

3710

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,710

白玙

2025-03-14

1644

详解大模型应用可观测全链路

阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。

白玙

1,644

大模型服务小助手

2025-07-01

1097

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

本文介绍如何利用智能体与Python代码批量处理Excel中的脏数据，解决人工录入导致的格式混乱、逻辑错误等问题。通过构建具备数据校验、异常标记及自动修正功能的系统，将数小时的人工核查任务缩短至分钟级，大幅提升数据一致性和办公效率。

大模型服务小助手

1,097

ModelScope

2024-05-15

15075

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,075

阿里云云原生

2024-05-15

93498

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测为切入点，对比 OpenTelemetry 与 Prometheus 的相同与差异，重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

阿里云云原生

93,498

星舰正泽

2024-05-15

78351

通义千问API：让大模型使用各种工具

本章我们将通过一个简单的例子，揭示基于LangChain的Agent开发的秘密，从而了解如何扩展大模型的能力。

星舰正泽

78,351

ant-ray项目组

2025-04-11

1066

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,066

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

速成RAG+Agent框架大模型应用搭建

大模型推理优化实践：KV cache复用与投机采样

详解大模型应用可观测全链路

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

当 OpenTelemetry 遇上阿里云 Prometheus

通义千问API：让大模型使用各种工具

AI开源框架：让分布式系统调试不再"黑盒"

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

速成RAG+Agent框架大模型应用搭建

大模型推理优化实践：KV cache复用与投机采样

详解大模型应用可观测全链路

Excel数据治理新思路：引入智能体实现自动纠错【Python+Agent】

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

当 OpenTelemetry 遇上阿里云 Prometheus

通义千问API：让大模型使用各种工具

AI开源框架：让分布式系统调试不再"黑盒"