ms-swift 微调 internlm3-8b-instruct(论文分类任务)

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 本文介绍了使用InternLM系列模型进行论文分类任务的微调全过程,包括环境配置、数据准备、预训练与SFT(监督微调)、权重合并、模型评测及上传至魔搭社区等步骤。使用ms-swift框架和Lora训练方法,在具备40GB显存的A100 GPU环境下完成训练,并通过Swift工具进行效果评估。

参考链接

https://vwpecqie443.feishu.cn/wiki/AdRfwyZfWiJPJJkwnhucGavSnBe

https://aicarrier.feishu.cn/wiki/I5ywwN1ZZi5m1pk5fhKcGL0Dn0j

https://aicarrier.feishu.cn/wiki/HfQuwYa4Xi4WJVkuNF3cygqnnch

https://swift.readthedocs.io/zh-cn/latest/Instruction/%E8%AF%84%E6%B5%8B.html

算力资源

这里我用的是书生的训练营给的算力资源,可以报名申请闯关提高算力,不过第五期的训练营从5月27日就已经开始了

环境

CUDA:12.2

显存:40GB(50% A100)

Python 包管理:conda

LLM:internlm3-8b-instruct

微调框架:ms-swift

训练方式:(预训练 + SFT)Lora

目标

InternLM 系列模型 进行微调,使其能够完成论文分类任务,然后进行打榜

https://aicarrier.feishu.cn/wiki/I5ywwN1ZZi5m1pk5fhKcGL0Dn0j

安装 ms-swift

1)创建 conda 环境

# 创建 conda 虚拟环境,环境名称为 swift,python 的版本为 3.10
conda create -n swift python=3.10

2)切换 环境

conda activate swift

3)安装 ms-swift

# ms-swift 全能力安装
pip install 'ms-swift[all]' -U

训练集

训练集:https://www.modelscope.cn/datasets/JimmyMa99/smartflow-arxiv-dataset/files

下载

1)安装 ModelScope

pip install modelscope

2)创建文件夹

mkdir -p /root/datasets/train

2)下载训练集

# 完整下载整个训练集,并下载到 /root/datasets/train 目录下
modelscope download --dataset JimmyMa99/smartflow-arxiv-dataset --local_dir /root/datasets/train

预训练

目标:让模型学习识别论文的基本结构、元数据和内容特征

1)新建训练脚本

# 创建 config 文件夹
mkdir config
# 脚本
vim config/internlm3-8b-pretrain.sh

internlm3-8b-instruct.sh:

可以自己定义一些参数,从第5行到第13行

swift 一些参数说明可参考:https://zhuanlan.zhihu.com/p/1920127302924235042

#!/bin/bash
############ 可自定义
# 指定基础模型,可以是模型路径
model="Shanghai_AI_Laboratory/internlm3-8b-instruct"
# 训练集路径(预训练 训练集)
data_path="/root/datasets/train/swift_formatted_pretrain_data.jsonl"
# 模型输出路径
output_dir="/root/swift_output/internlm3-8b-lora"
# 模型作者
model_author="fei"
# 训练后的模型名称
model_name="InternLM3-8B-Lora"
# 创建日志目录
LOG_DIR="logs"
mkdir -p $LOG_DIR 
# 获取当前时间戳,用于生成唯一的日志文件名
TIMESTAMP=$(date +"%Y%m%d_%H%M%S")
LOG_FILE="$LOG_DIR/internlm3-8b_lora_sft_${TIMESTAMP}.log"  
# 设置CUDA环境变量
export NPROC_PER_NODE=1
export OMP_NUM_THREADS=1
export CUDA_VISIBLE_DEVICES=0
export MASTER_PORT=$((10000 + RANDOM % 50000))
# 使用nohup命令在后台运行训练任务,即使终端关闭也能继续运行
nohup swift sft \
    --model $model \
    --train_type lora \
    --dataset $data_path \
    --torch_dtype bfloat16 \
    --num_train_epochs 2 \
    --per_device_train_batch_size 4 \
    --learning_rate 5e-5 \
    --warmup_ratio 0.1 \
    --split_dataset_ratio 0 \
    --lora_rank 8 \
    --lora_alpha 32 \
    --use_chat_template false \
    --target_modules all-linear \
    --gradient_accumulation_steps 2 \
    --save_steps 2000 \
    --save_total_limit 5 \
    --gradient_checkpointing_kwargs '{"use_reentrant": false}' \
    --logging_steps 5 \
    --max_length 2048 \
    --output_dir $output_dir \
    --dataloader_num_workers 256 \
    --model_author $model_author \
    --model_name $model_name \
    > "$LOG_FILE" 2>&1 &  
# 打印进程ID和日志文件位置,便于用户跟踪
echo "Training started with PID $!"  
echo "Log file: $LOG_FILE"  
# 提示用户如何实时查看日志
echo "To view logs in real-time, use:"
echo "tail -f $LOG_FILE"

2)执行预训练脚本

bash config/internlm3-8b-pretrain.sh

3)查看日志

# 要复制脚本执行后的,最后一条命令
tail -f logs/internlm3-8b_lora_sft_20250622_140355.log

4)训练结束

合并权重

将模型权重合并

# 复制日志中 last_model_checkpoint 对应的路径
swift export --adapters /root/swift_output/internlm3-8b-lora/v2-20250622-142204/checkpoint-144 --merge_lora true

SFT

目标:让模型学会准确分类,输出简洁答案

1)新建训练脚本

# 脚本
vim config/internlm3-8b-sft.sh

internlm3-8b-sft.sh:

可以自己定义一些参数,从第5行到第15行

swift 一些参数说明可参考:https://zhuanlan.zhihu.com/p/1920127302924235042

#!/bin/bash
############ 可自定义
# 指定基础模型路径,使用上面预训练合并后的路径
model="/root/swift_output/internlm3-8b-lora/v2-20250622-142204/checkpoint-144-merged"
# 训练集路径(sft 训练集)
data_path="/root/datasets/train/swift_formatted_sft_train_data.jsonl"
# 模型输出路径
output_dir="/root/swift_output/internlm3-8b-lora"
# 模型作者
model_author="fei"
# 训练后的模型名称
model_name="InternLM3-8B-Lora"
# swanlab的project名称
swanlab_project="InternLM3-8B-paper-classify-Lora"
# 创建日志目录
LOG_DIR="logs"
# 创建日志目录,-p参数确保即使目录已存在也不会报错
mkdir -p $LOG_DIR
# 获取当前时间戳
TIMESTAMP=$(date +"%Y%m%d_%H%M%S")
# 获取当前时间并格式化为年月日_时分秒格式
LOG_FILE="$LOG_DIR/internlm3-8b_lora_sft_${TIMESTAMP}.log"
# 组合日志文件路径,使用时间戳确保文件名唯一
# 设置CUDA设备
export NPROC_PER_NODE=1
# 设置每个节点的进程数为1
export OMP_NUM_THREADS=1
# 设置OpenMP线程数为1,限制并行线程数
export CUDA_VISIBLE_DEVICES=0
# 指定使用的GPU设备为0号设备
# 使用nohup命令在后台运行swift sft命令,即使终端关闭也能继续运行
nohup swift sft \
    --model $model \
    --train_type lora \
    --dataset $data_path \
    --torch_dtype bfloat16 \
    --num_train_epochs 2 \
    --per_device_train_batch_size 8 \
    --learning_rate 1e-4 \
    --warmup_ratio 0.1 \
    --report_to swanlab \
    --swanlab_project $swanlab_project \
    --split_dataset_ratio 0 \
    --lora_rank 8 \
    --lora_alpha 32 \
    --target_modules all-linear \
    --gradient_accumulation_steps 2 \
    --save_steps 2000 \
    --save_total_limit 5 \
    --gradient_checkpointing_kwargs '{"use_reentrant": false}' \
    --logging_steps 5 \
    --max_length 2048 \
    --output_dir $output_dir \
    --dataloader_num_workers 256 \
    --model_author $model_author \
    --model_name $model_name \
    > "$LOG_FILE" 2>&1 &
# 打印进程ID和日志文件位置
echo "Training started with PID $!"
# 显示训练进程的PID($!代表最近一个后台进程的PID)
echo "Log file: $LOG_FILE"
# 显示日志文件的路径
# 显示查看日志的命令
echo "To view logs in real-time, use:"
echo "tail -f $LOG_FILE"

2)安装 swanlab

SwanLab 是一款开源、轻量的 AI 模型训练跟踪与可视化工具,提供了一个跟踪、记录、比较、和协作实验的平台。

pip install swanlab

3)登录 swanlab

3.1)前往 swanlab 注册

网址:https://swanlab.cn/

3.2)获取 API Key

3.2)服务器登录

swanlab login
# 然后粘贴 API key
回车

4)执行 sft 训练脚本

bash config/internlm3-8b-sft.sh

5)查看日志

# 要复制脚本执行后的,最后一条命令
tail -f logs/internlm3-8b_lora_sft_20250622_152058.log

6)训练结束

7)通过 swanlab,了解到相关的数据【可选】

网址:https://swanlab.cn/space/~

合并权重

# 复制日志中 last_model_checkpoint 对应的路径
swift export --adapters /root/swift_output/internlm3-8b-lora/v5-20250622-155801/checkpoint-62 --merge_lora true

评测

准备

将评测数据集改名

# 添加 _val,是为了能让 swift 知道这个是评测数据
mv eval_oc_data.csv eval_oc_data_val.csv

注意:我下面不是用的这个评测集进行评测的,我把他移动到 /root/datasets/eval,并改名为 newformat_sft_test_data_val.csv

微调前

参考链接:https://swift.readthedocs.io/zh-cn/latest/Instruction/%E8%AF%84%E6%B5%8B.html

--eval_dataset general_mcq:通用选择题数据集

"local_path": "/root/datasets/eval":这个是数据集所在的路径

"subset_list": ["newformat_sft_test_data"]:这个数据集名称的前缀,我这里的文件是 newformat_sft_test_data_val.csv

官方文档说明

评测命令:

CUDA_VISIBLE_DEVICES=0 \
swift eval \
    --model Shanghai_AI_Laboratory/internlm3-8b-instruct \
    --eval_backend Native \
    --infer_backend pt \
    --eval_dataset general_mcq \
    --dataset_args '{"general_mcq": {"local_path": "/root/datasets/eval", "subset_list": ["newformat_sft_test_data"]}}'

微调后

/root/swift_output/internlm3-8b-lora/v5-20250622-155801/checkpoint-62-merged:是 sft 合并权重后的路径

评测命令:

CUDA_VISIBLE_DEVICES=0 \
swift eval \
    --model /root/swift_output/internlm3-8b-lora/v5-20250622-155801/checkpoint-62-merged \
    --eval_backend Native \
    --infer_backend pt \
    --eval_dataset general_mcq \
    --dataset_args '{"general_mcq": {"local_path": "/root/datasets/eval", "subset_list": ["newformat_sft_test_data"]}}'

上传到 魔搭社区(可跳)

网址:https://modelscope.cn/models/create

1)创建模型

2)上传模型

token获取:https://modelscope.cn/my/myaccesstoken

# feilieren/InternLM3-8B-paper-classify-Lora:为自己在魔搭社区创建的模型(个人名称/模型名称)
# /root/swift_output/internlm3-8b-lora/v5-20250622-155801/checkpoint-62-merged:合并权重后的模型参数路径
# YOUR-MODELSCOPE-TOKEN:要替换成自己的 魔搭社区token
modelscope upload feilieren/InternLM3-8B-paper-classify-Lora /root/swift_output/internlm3-8b-lora/v5-20250622-155801/checkpoint-62-merged --token YOUR-MODELSCOPE-TOKEN

目录
相关文章
|
2月前
|
物联网 开发工具 git
论文分类打榜赛Baseline:ms-swift微调InternLM实践
书生大模型实战营第5期已正式启动,本期实战营新增「论文分类打榜赛」,以帮助学员更好地掌握大模型技能。
137 12
|
机器学习/深度学习 人工智能 物联网
大模型时代,还缺一只雨燕 | SWIFT:魔搭社区轻量级微调推理框架
伴随着大数据的发展和强大的分布式并行计算能力,以预训练+微调的模型开发范式渐渐成为深度学习领域的主流。 2023年各家推出的大模型浩如烟海,如GPT4、Llama、ChatGLM、Baichuan、RWKV、Stable-Diffusion等。这些模型在达到越来越好的效果的同时也需要越来越多的算力资源:全量finetune它们动辄需要几十至上百G显存训练部署,一般的实验室和个人开发者无力承担。
|
12月前
|
调度 Swift Android开发
苹果iOS新手开发之Swift中的并发任务和消息机制
Swift的消息机制类似Android的Handler,实现任务调度有三种方式: 1. **Grand Central Dispatch (GCD)**:使用`DispatchQueue`在主线程或后台线程执行任务。 2. **OperationQueue**:提供高级接口管理`Operation`对象。 3. **RunLoop**:处理事件如输入源、计时器,类似Android的`Looper`和`Handler`。 **示例**: - GCD:在不同线程执行代码块。 - OperationQueue:创建操作并执行。 - RunLoop:用Timer添加到RunLoop中。
182 2
|
12月前
|
物联网 PyTorch 算法框架/工具
介绍一个大语言模型的微调框架Swift | AIGC
介绍一个大语言模型的微调框架Swift 【7月更文挑战第4天】
1266 3
|
存储 设计模式 安全
【Swift开发专栏】Swift的扩展与分类
【4月更文挑战第30天】Swift的扩展和枚举分类提供类型添加新功能的灵活性。文章分为三部分:扩展用于为已有类型添加属性、方法等,适用于功能扩展、代码组织;枚举分类定义相关值,支持原始值和关联值,用于状态表示和类型安全选项。扩展和分类在实际开发中应用于类型增强、状态管理及组合使用。了解并掌握这些特性,能提升代码的灵活性和可维护性。更多高级特性和应用值得进一步探索。
185 2
|
Swift
Swift之UIBarButtonItem添加一个分类
Swift之UIBarButtonItem添加一个分类
126 0
Swift之UIBarButtonItem添加一个分类
|
API Swift 开发者
Swift3.0带来的变化汇总系列三——函数和闭包写法上的微调
Swift3.0带来的变化汇总系列三——函数和闭包写法上的微调
136 0
|
Swift
swift UI专项训练32 Stepper微调控件
     跟滑块对应的时Stepper微调控件,有时候我们需要精确地变动,那么就不能用滑块来做,Stepper每次以一个固定的值来增加或者减少,它的设置跟滑块比就比较相似了: 也有最大值最小值和当前值,不同的是有Step这个值,也就是我们加减时的固定值,叫做步进值。
985 0
|
12月前
|
Unix 调度 Swift
苹果iOS新手开发之Swift 中获取时间戳有哪些方式?
在Swift中获取时间戳有四种常见方式:1) 使用`Date`对象获取秒级或毫秒级时间戳;2) 通过`CFAbsoluteTimeGetCurrent`获取Core Foundation的秒数,需转换为Unix时间戳;3) 使用`DispatchTime.now()`获取纳秒级精度的调度时间点;4) `ProcessInfo`提供设备启动后的秒数,不表示绝对时间。不同方法适用于不同的精度和场景需求。
372 3
|
8月前
|
安全 Swift iOS开发
Swift 与 UIKit 在 iOS 应用界面开发中的关键技术和实践方法
本文深入探讨了 Swift 与 UIKit 在 iOS 应用界面开发中的关键技术和实践方法。Swift 以其简洁、高效和类型安全的特点,结合 UIKit 丰富的组件和功能,为开发者提供了强大的工具。文章从 Swift 的语法优势、类型安全、编程模型以及与 UIKit 的集成,到 UIKit 的主要组件和功能,再到构建界面的实践技巧和实际案例分析,全面介绍了如何利用这些技术创建高质量的用户界面。
187 2

热门文章

最新文章

相关课程

更多