官方博客-第16页-阿里云开发者社区

新念

2025-02-14

1453

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,453

荣阳

2025-02-28

1057

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,057

ModelScope

2024-05-15

968

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

968

德灵

2024-05-15

118083

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,083

ModelScope

2024-05-15

759

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

759

阿里云云原生

2025-06-03

1106

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,106

继儒

2023-03-21

3130

Hologres技术揭秘，JSON半结构化数据的极致分析性能

本文将会揭秘Hologres JSONB半结构化数据的技术原理，实现JSON半结构数据的极致分析性能。

继儒

3,130

资源编排ROS

2023-12-01

703

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括：1. 工具准备：安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备：创建工程目录，进入虚拟环境，配置阿里云凭证信息，配置ROSCDK。3. 代码编写：根据文档描述，编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码：执行ROS代码，创建ECS实例并部署FTP服务。总体来说，本文通过简单的步骤，让小白也能快速上手使用ROS资源编排服务，实现自动化部署和管理阿里云资源。

资源编排ROS

703

阿里云实时数仓Hologres

2024-06-18

2335

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,335

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

阿里云PAI大模型RAG对话系统最佳实践

联合XTuner，魔搭社区全面支持数据集的长文本训练

实现企业级 MCP 服务统一管理和智能检索的实践

Hologres技术揭秘，JSON半结构化数据的极致分析性能

从零开始使用 ROS CDK 搭建云上解决方案

森马基于MaxCompute+Hologres+DataWorks构建数据中台

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

阿里云PAI大模型RAG对话系统最佳实践

联合XTuner，魔搭社区全面支持数据集的长文本训练

实现企业级 MCP 服务统一管理和智能检索的实践

Hologres技术揭秘，JSON半结构化数据的极致分析性能

从零开始使用 ROS CDK 搭建云上解决方案

森马基于MaxCompute+Hologres+DataWorks构建数据中台