大模型微调开源框架推荐-阿里云开发者社区

大模型微调开源框架推荐

2026-04-14 783

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： LLaMA-Factory（零代码WebUI，支持100+模型）、PEFT（Hugging Face官方高效微调库）、Axolotl（YAML配置驱动）、Unsloth（提速2–5倍、省显存80%）、DeepSpeed（微软大规模分布式训练）、Swift（达摩院出品，国产模型友好）。按需选型，覆盖全场景。

1. LLaMA-Factory

「GitHub」: https://github.com/hiyouga/LLaMA-Factory
「特点」:

支持 100+ 种 LLM 的微调（LLaMA、Mistral、Qwen、ChatGLM 等）
提供 WebUI 界面，零代码微调
支持 LoRA、QLoRA、全参数微调等多种方法
内置数据集处理和评估功能

2. PEFT (Parameter-Efficient Fine-Tuning)

「GitHub」: https://github.com/huggingface/peft
「特点」:

Hugging Face 官方出品
支持 LoRA、Prefix Tuning、P-Tuning、Adapter 等方法
与 Transformers 库深度集成
显存占用低，适合消费级显卡

3. Axolotl

「GitHub」: https://github.com/OpenAccess-AI-Collective/axolotl
「特点」:

配置驱动，通过 YAML 文件定义训练流程
支持多种模型和微调方法
内置 DeepSpeed、FSDP 分布式训练支持

4. Unsloth

「GitHub」: https://github.com/unslothai/unsloth
「特点」:

训练速度提升 2-5 倍，显存减少 80%
支持 LLaMA、Mistral、Gemma 等模型
对 QLoRA 优化极佳

5. DeepSpeed

「GitHub」: https://github.com/microsoft/DeepSpeed
「特点」:

微软出品，专注大规模分布式训练
ZeRO 优化器大幅降低显存需求
适合超大模型训练

6. Swift (ModelScope)

「GitHub」: https://github.com/modelscope/swift
「特点」:

阿里达摩院出品
对国产模型（Qwen、ChatGLM）支持好
提供完整的训练、推理、部署流程

快速选择建议

场景	推荐框架
新手入门、零代码	LLaMA-Factory
Hugging Face 生态	PEFT
显存有限、追求速度	Unsloth
超大规模分布式训练	DeepSpeed
国产模型微调	Swift

大模型微调开源框架推荐

1. LLaMA-Factory

2. PEFT (Parameter-Efficient Fine-Tuning)

3. Axolotl

4. Unsloth

5. DeepSpeed

6. Swift (ModelScope)

快速选择建议

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

大模型微调开源框架推荐

1. LLaMA-Factory

2. PEFT (Parameter-Efficient Fine-Tuning)

3. Axolotl

4. Unsloth

5. DeepSpeed

6. Swift (ModelScope)

快速选择建议

热门文章

最新文章

相关电子书