官方博客-第10页-阿里云开发者社区

阿里云大数据Al技术

2025-07-18

1075

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

阿里云大数据Al技术

1,075

阿里云云原生

2024-05-15

74014

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

74,014

易定

2024-12-06

1222

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,222

阿里云云原生

2025-04-17

1435

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评：最小成本适配我的开发风格、相当把团队经验沉淀下来，是个很好功能……

阿里云云原生

1,435

ModelScope

2024-05-15

110146

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,146

ModelScope

2024-05-15

1322

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,322

ModelScope

2024-05-15

904

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

904

一默

2024-08-26

408

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

408

新念

2025-02-14

1570

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,570

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

通义灵码技术解析，打造 AI 原生开发新范式

【实战干货】AI大模型工程应用于车联网场景的实战总结

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

vLLM部署Yuan2.0：高吞吐、更便捷

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

打破传统叙事逻辑，构建基于原子化任务的人机交互

DeepSeek-V3 高效训练关键技术分析

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

通义灵码技术解析，打造 AI 原生开发新范式

【实战干货】AI大模型工程应用于车联网场景的实战总结

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

vLLM部署Yuan2.0：高吞吐、更便捷

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

打破传统叙事逻辑，构建基于原子化任务的人机交互

DeepSeek-V3 高效训练关键技术分析