swift微调款框架使用自定义数据集进行通义千问1.5的微调

请问目前swift微调款框架支持python使用自定义数据集进行通义千问1.5的微调么？

展开

收起

宸术 2024-03-25 17:02:25 675 版权

阿里云 AI 助理回答

目前，Swift微调框架支持通过Python使用自定义数据集对通义千问1.5进行微调。以下是详细说明和操作指导：

1. 模型支持情况

根据知识库资料，通义千问1.5系列（如qwen1.5-7b-chat、qwen1.5-14b-chat等）支持多种微调方式，包括SFT（有监督微调）。这表明，通义千问1.5的开源版本可以通过微调框架进行定制化训练。

2. Swift微调框架的支持

Swift微调框架是阿里云提供的高效工具，允许用户通过Python接口加载自定义数据集，并对支持的模型进行微调。通义千问1.5作为开源模型，明确列在支持的模型列表中。因此，您可以使用Swift框架完成以下任务： - 加载自定义数据集。 - 配置微调参数（如学习率、批次大小等）。 - 启动微调任务。

3. 操作步骤

以下是基于Swift微调框架的操作流程：

（1）准备自定义数据集

数据集格式需符合要求，通常为JSON或CSV格式。
数据集应包含输入（input）和目标输出（output）字段，用于有监督微调。

（2）安装Swift微调框架

确保已安装Swift微调框架及相关依赖：

pip install swift

（3）加载模型与数据集

使用Python代码加载通义千问1.5模型及自定义数据集：

from swift import Swift, SFTTrainer

# 指定模型名称
model_id = "qwen1.5-7b-chat"

# 加载自定义数据集
train_dataset = load_dataset("path_to_your_dataset", split="train")
eval_dataset = load_dataset("path_to_your_dataset", split="validation")

# 初始化微调器
trainer = SFTTrainer(
    model_id=model_id,
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    max_length=2048,  # 根据模型支持的最大token长度设置
    batch_size=16,
    learning_rate=1.6e-5
)

# 启动微调
trainer.train()