LLaMA-Factory：大语言模型微调框架 | AIGC

2024-07-13 2737

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架，专为大型语言模型（LLMs）的微调而设计【7月更文挑战第5天】

LLaMA-Factory：大语言模型微调框架

一、功能特点

LLaMA-Factory 是一个国内北航开源的低代码大模型训练框架，专为大型语言模型（LLMs）的微调而设计。其主要功能特点包括：

高效且低成本：能够高效且低成本地支持对100多个模型进行微调，简化了模型微调的过程。
易于访问和使用：提供了友好的用户界面，用户无需编写代码即可轻松定制和微调LLMs。
丰富的数据集选项：支持多个数据集选项，用户可以选择自带的数据集或自己生成数据集进行微调。
多样化的算法支持：集成了业界最广泛使用的微调方法和优化技术，如LoRA、GaLore、DoRA等。
实时监控和评估：支持集成TensorBoard、VanDB和MLflow等监控工具，便于实时监控训练过程和评估模型性能。
极速推理：提供了基于vLLM的OpenAI风格API、浏览器界面和命令行接口，实现快速推理。

二、安装

LLaMA-Factory 的安装相对简单，以下是一般的安装步骤（以conda环境为例）：

创建Python环境：
使用conda创建一个新的Python环境，并安装必要的依赖库，如PyTorch等。
克隆LLaMA-Factory项目：
通过Git克隆LLaMA-Factory的源代码到本地。
```
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
```
安装依赖：
进入项目目录，安装必要的Python依赖库。
```
 cd LLaMA-Factory
 pip install -e ".[torch,metrics]"
```
启动服务：
在项目目录中运行python src/train_web.py启动服务，然后在浏览器中访问相应的端口（默认可能是7860）以访问训练界面。

三、支持的算法

LLaMA-Factory 支持多种先进的微调算法和模型，包括但不限于：

多种模型：LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。
集成方法：（增量）预训练、（多模态）指令监督微调、奖励模型训练、PPO 训练、DPO 训练、KTO 训练、ORPO 训练等等。
多种精度：16 比特全参数微调、冻结微调、LoRA 微调和基于 AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ 的 2/3/4/5/6/8 比特 QLoRA 微调。
先进算法：GaLore、BAdam、DoRA、LongLoRA、LLaMA Pro、Mixture-of-Depths、LoRA+、LoftQ、PiSSA 和 Agent 微调。
实用技巧：FlashAttention-2、Unsloth、RoPE scaling、NEFTune 和 rsLoRA。
实验监控：LlamaBoard、TensorBoard、Wandb、MLflow 等等。
极速推理：基于 vLLM 的 OpenAI 风格 API、浏览器界面和命令行接口。

四、性能指标

与 ChatGLM 官方的 P-Tuning 微调相比，LLaMA Factory 的 LoRA 微调提供了 3.7 倍的加速比，同时在广告文案生成任务上取得了更高的 Rouge 分数。结合 4 比特量化技术，LLaMA Factory 的 QLoRA 微调进一步降低了 GPU 显存消耗。

GPU现存消耗：

五、微调例子

以下是一个使用LLaMA-Factory对Yuan2.0模型进行LoRA微调的例子：

准备数据集：
准备自定义的数据集，可以是JSON格式，包含指令、输入和输出等信息。
注册数据集：
在LLaMA-Factory的数据集管理文件中注册自定义的数据集。
启动Web UI服务：
运行python src/train_web.py启动Web UI服务，并在浏览器中打开相应的地址。
配置微调参数：
在Web界面上配置模型路径、微调方法（选择LoRA）、数据集等参数。
开始微调：
点击“开始”按钮开始微调过程，可以在界面中查看训练进度和损失函数等信息。
评估模型：
微调完成后，使用LLaMA-Factory提供的评估工具对模型进行评估，检查模型性能是否有所提升。

通过以上步骤，用户可以利用LLaMA-Factory轻松实现LLMs的微调，提升模型在特定任务上的性能。

更多微调

https://github.com/hiyouga/LLaMA-Factory/blob/main/examples/README_zh.md

LLaMA-Factory：大语言模型微调框架 | AIGC

LLaMA-Factory：大语言模型微调框架

一、功能特点

二、安装

三、支持的算法

四、性能指标

五、微调例子

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

LLaMA-Factory：大语言模型微调框架 | AIGC

LLaMA-Factory：大语言模型微调框架

一、功能特点

二、安装

三、支持的算法

四、性能指标

五、微调例子

热门文章

最新文章

相关课程

相关电子书

相关实验场景