官方博客-第18页-阿里云开发者社区

新念

2025-02-14

1453

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,453

荣阳

2025-02-28

1057

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,057

阿里云云原生

2025-08-01

1047

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

1,047

茏久

2023-07-21

138785

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

本文从阿里云用户使用云原生数据仓库AnalyticDB PostgreSQL版（以下简称ADB PG）的实际体验出发，介绍ADB PG如何实现“一站式全文检索”业务，并详细阐述ADB PG使用的优势技术，最后提供对应业务案例分析。

茏久

138,785

寒亭

2023-09-18

47942

一次访问Redis延时高问题排查与总结（2）

本文是一次访问Redis延时高问题排查与总结的续篇，主要讲述了当时没有发现的一些问题和解决方案。

寒亭

47,942

ModelScope

2024-05-15

968

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

968

ModelScope

2024-05-15

759

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

759

数据库小助手

2024-11-19

1848

开源新发布｜PolarDB-X v2.4.1 增强企业级运维能力

PolarDB-X 是阿里云推出的云原生分布式数据库，自2021年10月开源以来，持续迭代升级，至2024年4月发布的v2.4.1版本，重点增强了企业级运维能力，如无锁变更、物理扩缩容、数据TTL等，提供金融级高可用、透明分布式、HTAP一体化等特性。PolarDB-X 支持集中式和分布式一体化形态，兼容MySQL生态，适用于金融、通信、政务等行业。

数据库小助手

1,848

阿里云瑶池数据库

2024-11-21

1551

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

针对雅迪“云销通App”的需求与痛点，本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案，助力销售人员高效用数，全面提升销售管理效率。

阿里云瑶池数据库

1,551

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

一次访问Redis延时高问题排查与总结（2）

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

联合XTuner，魔搭社区全面支持数据集的长文本训练

开源新发布｜PolarDB-X v2.4.1 增强企业级运维能力

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

如何使用AnalyticDB PostgreSQL 版实现“一站式全文检索”业务

一次访问Redis延时高问题排查与总结（2）

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

联合XTuner，魔搭社区全面支持数据集的长文本训练

开源新发布｜PolarDB-X v2.4.1 增强企业级运维能力

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力