官方博客-第22页-阿里云开发者社区

ModelScope

2024-05-15

1138

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,138

ModelScope

2024-05-15

748

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

748

李泽政

2024-11-01

817

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

817

龙蜥社区OpenAnolis

2024-11-06

757

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

757

李德

2024-12-06

1348

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,348

赵世振

2025-01-09

2073

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

本文章旨在帮助读者了解并掌握大模型多模态技术的实际应用，特别是如何构建基于多模态的实用场景。文档通过几个具体的多模态应用场景，如拍立淘、探一下和诗歌相机，展示了这些技术在日常生活中的应用潜力。

赵世振

2,073

殳玄

2025-01-16

1029

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,029

新念

2025-02-14

1439

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,439

荣阳

2025-02-28

1045

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,045

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

现身说法，AI小白的大模型学习路径

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

联合XTuner，魔搭社区全面支持数据集的长文本训练

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

现身说法，AI小白的大模型学习路径

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程