使用PAI×LLaMA Factory 微调 Llama3 模型

2024-07-23 700 发布于浙江

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

模型训练 PAI-DLC，100CU*H 3个月

交互式建模 PAI-DSW，每月250计算时 3个月

简介： 本次教程介绍了如何使用PAI和LLaMA Factory框架，基于轻量化LoRA方法微调Llama-3模型，使其能够进行中文问答和角色扮演，同时通过验证集ROUGE分数和人工测试验证了微调的效果。在后续实践中，可以使用实际业务数据集，对模型进行微调，得到能够解决实际业务场景问题的本地领域大模型。

教程简述

LLaMA Factory是一款开源低代码大模型微调框架，集成了业界最广泛使用的微调技术，支持通过Web UI界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架，GitHub星标超过2万。

本教程将基于Meta AI开源的Llama-3 8B模型，介绍如何使用PAI平台及LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估。

通过云起实验室一键开启AI体验：https://developer.aliyun.com/adc/scenario/exp/544084672a6942b7ac1809a4df8410f3

本教程使用PAI ×LLaMA Factory 微调 Llama3 模型后，问答机器人模仿诸葛亮的语气对话效果如下：

基于本教程可以体验：
👍新用户可免费领取价值万元的人工智能平台PAI试用资源

👍学会如何快速在阿里云上创建一个交互式训练开发环境

👍学会如何在DSW中基于LLaMA Factory训练框架完成模型的中文化与角色扮演微调和评估

👍学会如何在WebUI中进行知识问答

答疑交流群

如需技术支持，请在钉钉搜索群号「 52485000325」，加入群聊

实验教程

1. 准备环境和资源

1.1. 领取交互式建模PAI-DSW免费试用权益，并准备PAI工作空间

前往活动页面，领取交互式建模PAI-DSW产品免费试用资源包

对于交互式建模 PAI-DSW 的新用户，阿里云提供了5000CU*H 的免费试用资源，可以在活动页面中直接领取（试用规则请参照阿里云免费试用：https://free.aliyun.com/）；或可以购买交互式建模 PAI-DSW 资源包参与活动，购买链接：PAI-DSW 100CU*H资源包，价格 59 元起；如不购买资源包，PAI-DSW 会；按量进行计费，计费标准详见阿里云产品定价。

开通机器学习PAI并创建默认工作空间

前往PAI控制台，其中关键参数配置如下：

本教程地域选择：华北2（北京）。您也可以根据情况选择华东1（杭州）、华东2（上海）、华南1（深圳）地域。
组合开通：本教程无需使用其他产品，去除勾选MaxCompute和DataWorks产品。
服务角色授权：单击去授权，完成服务角色授权。

说明：更多详细内容，请参见开通并创建默认工作空间。

1.2. 进入PAI NotebookGallery

在左侧导航栏中，选择快速开始>NotebookGallery。

在Notebook Gallery页面，单击LLaMA Factory：微调LLaMA3模型实现角色扮演。

在详情页面，您可查看到预置的使用LLaMA Factory微调Llama3模型教程，单击右上角的在DSW中打开。

在请选择对应实例对话框中，单击新建DSW实例。

1.3. 创建PAI-DSW实例

在配置实例页面，自定义输入实例名称，例如DSW_LlamaFactory。

在配置实例页面的资源配额区域，GPU规格分类下的ecs.gn6v-c8g1.2xlarge或ecs.gn7i-c8g1.2xlarge，建议优先选择ecs.gn7i-c8g1.2xlarge。

说明：

若您是PAI产品新用户，请再次确认是否已领取免费使用权益。领取方式：前往活动页【链接待更新】，根据页面提示领取免费试用权益。若您未领取免费试用权益，或不符合免费试用条件，或历史已领取且免费试用额度用尽或到期，完成本实验将产生扣费，大约为10-30元/小时。
请在实验完成后，参考最后一章节清理及后续，停止/删除实例，以免产生不必要的扣费或资源消耗。