使用PAI×LLaMA Factory 微调 Llama3 模型

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 本次教程介绍了如何使用PAI和LLaMA Factory框架,基于轻量化LoRA方法微调Llama-3模型,使其能够进行中文问答和角色扮演,同时通过验证集ROUGE分数和人工测试验证了微调的效果。在后续实践中,可以使用实际业务数据集,对模型进行微调,得到能够解决实际业务场景问题的本地领域大模型。

活动地址https://developer.aliyun.com/topic/llamafactory

活动时间:7月25日- 9月1日

活动任务:使用 PAI 平台及 LLaMA Factory 训练框架完成模型的中文化与角色扮演微调和评估,搭建专属“ AI 诸葛亮”问答机器人,7×24小时为你出谋划策!

Pai pc.png

活动玩法

1.热门任务

完成PAI × LaMA Factory 微调 Llama3 模型实验体验,搭建专属“ AI 诸葛亮”问答机器人,并上传原创对话截图(作品提交后系统T+1个工作日完成审核),即可领取户外运动腰包(限量200个),先到先得哦~

image.png

2. 邀请挑战

邀请好友完成任务一场景体验,参与PK赢取大奖!

image.png ※ 详情可见活动规则

教程简述

LLaMA Factory是一款开源低代码大模型微调框架,集成了业界最广泛使用的微调技术,支持通过Web UI界面零代码微调大模型,目前已经成为开源社区内最受欢迎的微调框架,GitHub星标超过2万。

本教程将基于Meta AI开源的Llama-3 8B模型,介绍如何使用PAI平台及LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估。

通过云起实验室一键开启AI体验:https://developer.aliyun.com/adc/scenario/exp/544084672a6942b7ac1809a4df8410f3


本教程使用PAI ×LLaMA Factory 微调 Llama3 模型后,问答机器人模仿诸葛亮的语气对话效果如下:

image.png


基于本教程可以体验:
👍新用户可免费领取价值万元的人工智能平台PAI试用资源

👍学会如何快速在阿里云上创建一个交互式训练开发环境

👍学会如何在DSW中基于LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估

👍学会如何在WebUI中进行知识问答


答疑交流群

如需技术支持,请在钉钉搜索群号「 52485000325」,加入群聊


实验教程

1. 准备环境和资源

1.1. 领取交互式建模PAI-DSW免费试用权益,并准备PAI工作空间

前往活动页面,领取交互式建模PAI-DSW产品免费试用资源包

image.png

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会;按量进行计费,计费标准详见阿里云产品定价。

开通机器学习PAI并创建默认工作空间

前往PAI控制台,其中关键参数配置如下:

  • 本教程地域选择:华北2(北京)。您也可以根据情况选择华东1(杭州)、华东2(上海)、华南1(深圳)地域。
  • 组合开通:本教程无需使用其他产品,去除勾选MaxCompute和DataWorks产品。
  • 服务角色授权:单击去授权,完成服务角色授权。

说明:更多详细内容,请参见开通并创建默认工作空间

image.png

1.2. 进入PAI NotebookGallery

登录PAI控制台

在左侧导航栏中,选择快速开始>NotebookGallery。

image.png

在Notebook Gallery页面,单击LLaMA Factory:微调LLaMA3模型实现角色扮演。

image.png

在详情页面,您可查看到预置的使用LLaMA Factory微调Llama3模型教程,单击右上角的在DSW中打开。

image.png

在请选择对应实例对话框中,单击新建DSW实例。

image.png

1.3. 创建PAI-DSW实例

在配置实例页面,自定义输入实例名称,例如DSW_LlamaFactory。

image.png

在配置实例页面的资源配额区域,GPU规格分类下的ecs.gn6v-c8g1.2xlarge或ecs.gn7i-c8g1.2xlarge,建议优先选择ecs.gn7i-c8g1.2xlarge

说明:

  • 若您是PAI产品新用户,请再次确认是否已领取免费使用权益。领取方式:前往活动页【链接待更新】,根据页面提示领取免费试用权益。若您未领取免费试用权益,或不符合免费试用条件,或历史已领取且免费试用额度用尽或到期,完成本实验将产生扣费,大约为10-30元/小时。
  • 请在实验完成后,参考最后一章节清理及后续,停止/删除实例,以免产生不必要的扣费或资源消耗。

image.png

在配置实例页面的选择镜像区域,请确认镜像是否为官方镜像的modelscope:1.14.0-pytorch2.1.2-gpu-py310-cu121-ubuntu22.04。

image.png

在配置实例页面,未提及的参数保持默认即可,单击下一步。

image.png

在确认订单页面,检查订单的资源配置是否为ecs.gn6v-c8g1.2xlarge或ecs.gn7i-c8g1.2xlarge,选择镜像是否为modelscope:1.14.0-pytorch2.1.2-gpu-py310-cu121-ubuntu22.04,信息确认无误后,单击创建实例。

image.png

在交互式建模(DSW)页面,请您耐心等待大约5分钟左右,当状态变为运行中时,表示实例创建成功。

image.png

1.4 打开实例并下载框架、数据集

在选择对应实例对话框中,单击DSW实例右侧 image.png 图标,在DSW实例中选择您刚创建的实例,单击确定。

image.png

运行Notebook教程文件

安装LLaMA Factory

在llama_factory.ipynb文件的安装LLaMA Factory区域,根据教程指引,依次运行命令。

说明:单击命令左侧的运行按钮表示开始运行任务,当左侧为号时表明成功运行结束。

image.png

下载数据集

llama_factory.ipynb文件的下载数据集区域,根据教程指引,依次运行命令。

说明:单击命令左侧的运行按钮表示开始运行任务,当左侧为号时表明成功运行结束。

image.png

2. WebUI界面零代码实现模型微调模型微调

三步骤、零代码、WebUI界面完成模型微调,让开源大语言模型Llama3实现中文能力增强。

2.1. 启动Web UI

单击命令左侧的运行按钮表示开始运行任务,当左侧为号时表明成功运行结束。

image.png

然后单击返回的URL地址,进入Web UI页面。

image.png

2.2. 配置参数

进入WebUI后,可以切换到中文(zh)。首先配置模型,本教程选择LLaMA3-8B-Chat模型,微调方法则保持默认值lora,使用LoRA轻量化微调方法能极大程度地节约显存。

image.png

数据集使用上述步骤下载的train.json,单击预览数据集。

image.png

在弹窗中,您可以预览train.json数据集。

image.png

设置学习率为1e-4,梯度累积为2,有利于模型拟合。如果显卡是V100,计算类型保持为fp16;如果使用了A10,可以更改计算类型为bf16。

说明:创建PAI-DSW实例时,如果GPU规格选择ecs.gn6v-c8g1.2xlarge,则显卡是V100;如果GPU规格选择ecs.gn7i-c8g1.2xlarge,则显卡是A10。

image.png

单击LoRA参数设置展开参数列表,设置LoRA+学习率比例为16,LoRA+被证明是比LoRA学习效果更好的算法。在LoRA作用模块中填写all,即将LoRA层挂载到模型的所有线性层上,提高拟合效果。

image.png

将输出目录修改为train_llama3,训练后的LoRA权重将会保存在此目录中。单击预览命令可展示所有已配置的参数,您如果想通过代码运行微调,可以复制这段命令,在命令行运行。然后单击开始。

image.png

启动微调后需要等待一段时间,待模型下载完毕后可在界面观察到训练进度和损失曲线。

模型微调大约需要20分钟,下方显示训练完毕代表微调成功。

image.png

3. 模型评估

微调完成后,点击页面顶部的「刷新适配器」,然后点击适配器路径,即可弹出刚刚训练完成的LoRA权重,点击选择下拉列表中的train_llama3选项,在模型启动时即可加载微调结果。

image.png

选择「Evaluate&Predict」栏,在数据集下拉列表中选择「eval」(验证集)评估模型。更改输出目录为eval_llama3,模型评估结果将会保存在该目录中。最后点击开始按钮启动模型评估。

image.png

模型评估大约需要5分钟左右,评估完成后会在界面上显示验证集的分数。其中ROUGE分数衡量了模型输出答案(predict)和验证集中标准答案(label)的相似度,ROUGE分数越高代表模型学习得更好。

image.png

4. 模型对话

选择「Chat」栏,确保适配器路径是train_llama3,点击「加载模型」即可在Web UI中和微调模型进行对话。

image.png

在页面底部的对话框输入想要和模型对话的内容,点击「提交」即可发送消息。发送后模型会逐字生成回答,从回答中可以发现模型学习到了数据集中的内容,能够恰当地模仿诸葛亮的语气对话。

image.png

点击「卸载模型」,点击“×”号取消适配器路径,再次点击「加载模型」,即可与微调前的原始模型聊天。

image.png

重新向模型发送相同的内容,发现原始模型无法模仿诸葛亮的语气生成中文回答。

image.png

5. 清理及后续

  • 如果无需继续使用DSW实例,您可以按照以下操作步骤停止或删除DSW实例。
  1. 登录PAI控制台
  2. 在页面左上方,选择DSW实例的地域。
  3. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击默认工作空间名称,进入对应工作空间内。
  4. 在工作空间页面的左侧导航栏选择模型开发与训练>交互式建模(DSW),进入交互式建模(DSW)页面。
  5. 单击目标实例操作列下的停止,成功停止后即停止资源消耗。
  6. 如果您不再需要DSW实例,单击目标实例操作列下的删除
  • 领取免费资源包后,请在免费额度和有效试用期内使用。如果免费额度用尽或试用期结束后,继续使用计算资源,会产生后付费账单。

请前往节省计划页面,查看抵扣包剩余金额和过期时间。

image.png

  • 如果需要继续使用DSW实例,请务必至少在试用到期1小时前为您的阿里云账号充值,到期未续费的DSW实例会因欠费而被自动停止。
  • 在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

6. 总结

本次教程介绍了如何使用PAI和LLaMA Factory框架,基于轻量化LoRA方法微调Llama-3模型,使其能够进行中文问答和角色扮演,同时通过验证集ROUGE分数和人工测试验证了微调的效果。在后续实践中,可以使用实际业务数据集,对模型进行微调,得到能够解决实际业务场景问题的本地领域大模型。



相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
4天前
|
机器学习/深度学习 数据采集 数据挖掘
实战派教学:掌握Scikit-learn,轻松实现数据分析与机器学习模型优化!
【10月更文挑战第4天】Scikit-learn凭借高效、易用及全面性成为数据科学领域的首选工具,简化了数据预处理、模型训练与评估流程,并提供丰富算法库。本文通过实战教学,详细介绍Scikit-learn的基础入门、数据预处理、模型选择与训练、评估及调优等关键步骤,助你快速掌握并优化数据分析与机器学习模型。从环境搭建到参数调优,每一步都配有示例代码,便于理解和实践。
27 2
|
20天前
|
机器学习/深度学习 人工智能 分布式计算
使用PAI+LLaMA Factory 微调 Qwen2-VL 模型,搭建文旅领域知识问答机器人
本次教程介绍了如何使用 PAI 和 LLaMA Factory 框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
|
29天前
|
机器学习/深度学习 算法 数据可视化
机器学习模型中特征贡献度分析:预测贡献与错误贡献
本文将探讨特征重要性与特征有效性之间的关系,并引入两个关键概念:预测贡献度和错误贡献度。
89 3
|
7天前
|
机器学习/深度学习 算法 知识图谱
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
|
7天前
|
机器学习/深度学习 算法 数据挖掘
机器学习入门(二):如何构建机器学习模型,机器学习的三要素,欠拟合,过拟合
机器学习入门(二):如何构建机器学习模型,机器学习的三要素,欠拟合,过拟合
|
23天前
|
机器学习/深度学习 数据可视化 JavaScript
探索机器学习模型的可视化技术
【9月更文挑战第23天】在数据科学中,理解和解释机器学习模型的决策过程是至关重要的。本文将介绍几种流行的可视化工具和库,如TensorBoard、D3.js等,帮助读者更好地理解模型内部工作原理及其预测结果。通过实例演示如何使用这些工具进行模型可视化,增强模型的可解释性。
|
1月前
|
机器学习/深度学习 Python
验证集的划分方法:确保机器学习模型泛化能力的关键
本文详细介绍了机器学习中验证集的作用及其划分方法。验证集主要用于评估模型性能和调整超参数,不同于仅用于最终评估的测试集。文中描述了几种常见的划分方法,包括简单划分、交叉验证、时间序列数据划分及分层抽样划分,并提供了Python示例代码。此外,还强调了在划分数据集时应注意随机性、数据分布和多次实验的重要性。合理划分验证集有助于更准确地评估模型性能并进行有效调优。
|
29天前
|
机器学习/深度学习 数据采集 算法
机器学习新纪元:用Scikit-learn驾驭Python,精准模型选择全攻略!
在数据爆炸时代,机器学习成为挖掘数据价值的关键技术,而Scikit-learn作为Python中最受欢迎的机器学习库之一,凭借其丰富的算法集、简洁的API和高效性能,引领着机器学习的新纪元。本文通过一个实际案例——识别垃圾邮件,展示了如何使用Scikit-learn进行精准模型选择。从数据预处理、模型训练到交叉验证和性能比较,最后选择最优模型进行部署,详细介绍了每一步的操作方法。通过这个过程,我们不仅可以看到如何利用Scikit-learn的强大功能,还能了解到模型选择与优化的重要性。希望本文能为你的机器学习之旅提供有价值的参考。
34 0
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
6天前
|
机器学习/深度学习 算法 决策智能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能
【机器学习】揭秘深度学习优化算法:加速训练与提升性能

相关产品

  • 人工智能平台 PAI