官方博客-第17页-阿里云开发者社区

新念

2025-02-14

1393

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,393

尹斌斌周絮

2025-03-21

749

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

749

ModelScope

2024-05-15

712

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

712

牛俊

2024-08-15

11729

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,729

飒爽

2024-09-04

532

用Prompt技巧激发无限创意

本文深入探讨当前最前沿的prompt engineering方案，结合OpenAI、Anthropic和Google等大模型公司的资料，以及开源社区中宝贵的prompt技巧分享，全面解析这一领域的实践策略。

飒爽

532

垚佳汐遥

2024-10-23

1003

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,003

李泽政

2024-11-01

785

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

785

龙蜥社区OpenAnolis

2024-11-06

1305

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

模块相比传统文件有哪些优势？

龙蜥社区OpenAnolis

1,305

舟谨

2024-12-13

443

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

443

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

解决隐式内存占用难题

联合XTuner，魔搭社区全面支持数据集的长文本训练

动手实践：高效构建企业级AI搜索

用Prompt技巧激发无限创意

通义灵码知识库问答增强：知识库构建与管理指南

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

如何提取手写票据信息

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

解决隐式内存占用难题

联合XTuner，魔搭社区全面支持数据集的长文本训练

动手实践：高效构建企业级AI搜索

用Prompt技巧激发无限创意

通义灵码知识库问答增强：知识库构建与管理指南

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

如何提取手写票据信息