PAI-EasyTransfer应用实践

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 阿里算法专家李鹏(同润)在阿里云开发者社区特别栏目《周二开源日》直播中,介绍PAI上大规模分布式预训练,DSW环境中基于ModelZoo的文本分类实践,Fashionbert训练和评测实践,PAI上基于AppZoo的应用实践。本文为直播内容文字整理,看直播回放,请点击文首链接~

查看精彩回放:https://developer.aliyun.com/live/245530



大纲:

本文主要围绕实践做四部分的介绍,由浅入深层层递进,这四部分是:

  • AppZoo实践
  • ModelZoo实践
  • 分布式训练实践
  • 多模态Fashionbert实践

 

一、AppZoo实践

AppZoo像苹果的应用商店一样简单易用,里面的应用丰富多样,有分类匹配、阅读理解、序列标注和文本生成。

image.png

文本分类实践

在操作文本分类前,首先可以先熟悉下Easy-Transfor文档,了解下文本分类的流程,基本可以在云端完成操作AppZoo的文本分类的组件。

 

如下图所示,文本分类由几部分组成:

  • 原始文本
  • 文本预处理,处理成Bert需要的表征格式;
  • 然后送入Bert分类器产生标签。

 

如何在云端基于AppZoo操作文本分类,整个过程只需在本地起一个Job然后发送到云端,通过一些简单的配置就可以完成文本分类的应用了。

image.png

 

演示实践

基于本地的开发环境,首先上传所需的业务数据,如下图所示。

1.png

这是最简单的一句话的分类。左边是一句话,右边是这句话对应的label,比如第一句话“上课时老师手机响的不停”对应的是108。把这些实际的分类的标签映射成离散的值。

 

然后运行一下脚本,把业务数据的训练集和验证集上传到阿里云的ODPS的数据存储空间里。

1.png

然后在本地启动脚本,自动地运行文本分类。首先需要指定pi命令,这里叫做easy_transfer_app,然后指定训练模式和刚刚上传的训练集和验证机的名字。然后再告诉EasyTransfer AppZoo什么是标签及标签的类型。

1.png

当所有的都配置好后,只需要在本地运行app.run_sh,就能把任务提交到阿里云上的服务器集群上,由这个集群负责文本分类的应用。

 

一些常用的自然语言处理所需要的功能,高度抽象地封装成了一个个组件供大家调用,又简单又便捷,这就是AppZoo的好处。

 

任务启动后,如果想要检查日志状况可以通过Cloud View查看。

1.png

 

当初始化脚本完成后,Easy-Transfer AppZoo提供了强大的日志功能,用来记录化器以及warm up step等等,甚至是Bert里面用到的参数量等信息都会被详细的记录下来。

 

如下图所示,在云端PAI平台上已经成功启动了单机四卡,一个分布式的任务来做文本分类。

 1.png

当操作完成后,系统会把Model Dir记录在阿里云上一个OSS对象存储空间里。

 

二、ModelZoo实践

 

自然语言处理的套路方法趋向于统一化,分为以下这么四个步骤:通用领域的预训练、垂直领域的预训练、垂直领域的Finetune和通用知识蒸馏。

 1.png

现在启动云端的run tf summary,看一下选的这个预训练模型是否收敛了。

1.png 

 

通过tensor board看一下是否真的收敛了。我们在EasyTransfer里面放了很多实践,这里面average loss就是最佳实践,它植入了一个滑动窗口,上面积累了loss,从而能从宏观上看到loss走向。

1.png 

 

EasyTransfer设计了前后端分离的模式,用户仅仅需要聚焦在他修改的那一部分的前端代码,他可以很轻松地像搭积木的方式去尝试各种各样的chick

 1.png


下面演示一下如何调试。要做一个文本分类,我只需要做几个关键的步骤,第一是数据准备,第二是定义配置文件,第三个是定义分类应用,第四是启动训练,第五是启动预测。

 1.png


接下来看下载的数据到底是什么样子。在这里,数据是农业的分类,内容就是一句话,训练集样本数有1万多条,训练样本1万多条。接下来为了完成一个训练任务,需要去简单配置一下,包括分类的label数。接下来看一些代码,了解我们前端的API是什么样子的,把APP Zoo的黑盒变白盒。

1.png

 

现在运行这个cell,运行后这个构图的loss就完成了,然后启动训练。这里的日志训练样本有5万多条,我们在浏览器中就能完成经典的文本分类任务。

 1.png

 

接下来开始进行在线预测。在finetune环节,当PAI代码已经固化了之后,完全可以仅去调配置文件。基于PAI DSW,进一步调参前端代码。

 1.png

三、分布式训练实践

 

在做大量业务数据的垂直领域的预训练模型时,需要我们具备全栈思维,它需要具备以下要素。

 

首先要了解集群的分布,机柜里每一片都是主机。显卡是4块一组,它们通过某种桥接的方式在主机内部进行高速的通信。其次是RDMA,它可以把机器内存直接连起来,让他们直接进行数据通信,它通信的是梯度。然后是数据并行,它可以通过增加机器来把不同的数据放到不同的GPU上,增加训练速度。

 1.png

 

PAI上进行多机多卡分布式预训练时,使用参数也非常简单。EasyTransfer已经将复杂的预训练过程抽象成了几个公共组件,在数据准备、特征生成和训练过程中都可以直接用。

 1.png

 

实践演示

 

开始还是简单的配置,然后开启编译优化,打开RDMA,选择mlm loss等等,配置完之后输入命令run pretrain,启动一个88卡共64张卡的任务。

 1.png


然后点击logview,可以看到88卡。并且,在云端做高性能、分布式、超大规模的训练非常简单,因为EasyTransfer已经将常规组件封装在了script里。

 1.png

 

多模态Fashionbert实践

 

多模态本质上是将文本的模态和图像、视频、声音等各个模态的信息混合起来,学习出他们交互的表征,用到下游的视频分类、跨模态检索、VQA等等,它的目的是通过增加模态来提升下游任务的指标。那么如何通过EasyTransfer来从头开始构建变种版bert呢,我们研发了一种叫Fashionbert的概念。

1.png

 

二次开发实践

 

作为一个平台开发人员,当要增加新的功能的时候,需要run Fashionbert,比如run train。看一下左上角,这里唯一需要做的就是在ModelZoo里面定义一个多模态的bert,而里面各种各样的组件都封装好了,让搭建非常简单。

 1.png

 

最后附上EasyTransfer的开源信息,大家可以通过这些渠道有进一步了解。

 image.png

 

本次分享就到这里了,欢迎大家在GitHub上共建EasyTransfer社区。

 

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
12天前
|
机器学习/深度学习 监控 算法
机器学习在图像识别中的应用:解锁视觉世界的钥匙
机器学习在图像识别中的应用:解锁视觉世界的钥匙
224 95
|
2月前
|
人工智能 JSON 算法
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
阿里云的人工智能平台 PAI,作为一站式、 AI Native 的大模型与 AIGC 工程平台,为开发者和企业客户提供了 Qwen2.5-Coder 系列模型的全链路最佳实践。本文以Qwen2.5-Coder-32B为例,详细介绍在 PAI-QuickStart 完成 Qwen2.5-Coder 的训练、评测和快速部署。
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
|
20天前
|
机器学习/深度学习 数据采集 运维
机器学习在运维中的实时分析应用:新时代的智能运维
机器学习在运维中的实时分析应用:新时代的智能运维
73 12
|
23天前
|
编解码 机器人 测试技术
技术实践 | 使用 PAI+LLaMA Factory 微调 Qwen2-VL 模型快速搭建专业领域知识问答机器人
Qwen2-VL是一款具备高级图像和视频理解能力的多模态模型,支持多种语言,适用于多模态应用开发。通过PAI和LLaMA Factory框架,用户可以轻松微调Qwen2-VL模型,快速构建文旅领域的知识问答机器人。本教程详细介绍了从模型部署、微调到对话测试的全过程,帮助开发者高效实现定制化多模态应用。
|
1月前
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
49 12
|
2天前
|
人工智能 容灾 Serverless
AI推理新纪元,PAI全球化模型推理服务的创新与实践
本次分享主题为“AI推理新纪元,PAI全球化模型推理服务的创新与实践”,由阿里云高级产品经理李林杨主讲。内容涵盖生成式AI时代推理服务的变化与挑战、play IM核心引擎的优势及ES专属网关的应用。通过LM智能路由、多模态异步生成等技术,PAI平台实现了30%以上的成本降低和显著性能提升,确保全球客户的业务稳定运行并支持异地容灾,目前已覆盖16个地域,拥有10万张显卡的推理集群。
|
2天前
|
人工智能 运维 API
PAI企业级能力升级:应用系统构建、高效资源管理、AI治理
PAI平台针对企业用户在AI应用中的复杂需求,提供了全面的企业级能力。涵盖权限管理、资源分配、任务调度与资产管理等模块,确保高效利用AI资源。通过API和SDK支持定制化开发,满足不同企业的特殊需求。典型案例中,某顶尖高校基于PAI构建了融合AI与HPC的科研计算平台,实现了作业、运营及运维三大中心的高效管理,成功服务于校内外多个场景。
|
1月前
|
机器学习/深度学习 存储 运维
分布式机器学习系统:设计原理、优化策略与实践经验
本文详细探讨了分布式机器学习系统的发展现状与挑战,重点分析了数据并行、模型并行等核心训练范式,以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性,旨在提供一套全面的技术解决方案,以应对超大规模模型训练中的计算、存储及通信挑战。
70 4
|
2月前
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
52 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索机器学习:从理论到实践
在这篇文章中,我们将深入探讨机器学习的世界。我们将首先了解机器学习的基本概念和原理,然后通过一个简单的代码示例,展示如何实现一个基本的线性回归模型。无论你是初学者还是有经验的开发者,这篇文章都将帮助你更好地理解和应用机器学习。