DSW-Gallery使用体验+生成吸引人眼球的新闻标题

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 本文利用EasyNLP进行模型构建、训练、评估、预测生成中文新闻标题,介绍如何在PAI-DSW中使用EasyNLP

在实操上手操作之前,首先需要确认一下相关的专业名词的定义。

什么是EasyNLP

官方文档中定义:EasyNLP是PyTorch中易于使用的NLP开发和应用工具包,它采用可扩展的分布式训练策略构建,并支持适用于各种NLP应用的一整套NLP算法。集成了知识蒸馏和few-shot learning,用于落地大型预训练模型。

什么是mT5

官方定义是:T5是由谷歌提出的一个序列到序列预训练模型,它将不同的生成任务进行统一,在兼顾迁移性的前提下取得了文本生成领域的最佳性能。mT5是T5的多语言版本,该模型利用包含101种语言的语料训练得到多语言预训练模型。

在EasyNLP中,我们提供了经过训练的mT5(其它模型可见列表),以便用户能够受益于模型强大的建模能力。该模型是在mT5的基础上利用新闻数据进行微调得到。本文将以生成吸引人眼球的新闻标题为例,将mT5作为模型底座构建标题生成模型,展示如何利用EasyNLP进行模型构建、训练、评估、预测。

生成吸引人眼球的新闻标题

机器学习PAI体验地址:https://click.aliyun.com/m/1000370361/

开通机器学习PAI服务

如果没有开通机器学习PAI,那么你需要先开通

image.png

点击【免费开通并创建默认工作空间】

image.png

确认之后会出现弹窗提示,

image.png

我们选择【去授权】,进入到授权页面

image.png

点击【同意授权】之后,再次回到开通页面点击确认按钮,会看到【等待...】的提示

image.png

等待之后就显示开通成功

image.png

生成新闻标题

点击机器学习PAI首页的DSW Gallery,找到【基于EasyNLP的中文新闻标题生成】

image.png

创建DSW实例

点击【在DSW中打开】,这时会弹出页面选择实例

image.png

这里如果DSW实例没有可选项的话,点击选择框下面的【这里】跳转到创建DSW实例页面。

image.png

输入自定义实例名称,这里选择GPU P100 60GB的资源

image.png

镜像选择PAI-Pytorch 1.7/1.8镜像,这样创建的DSW实例才符合基于EasyNLP的中文新闻标题生成 所需要的环境要求

image.png

点击【确认订单】跳转到确认页面

image.png

再次确认实例信息后勾选协议点击【创建实例】完成创建。

EasyNLP安装

后续参考操作内容进行EasyNLP安装

! git clone https://github.com/alibaba/EasyNLP.git
! pip install -r EasyNLP/requirements.txt -i http://mirrors.aliyun.com/pypi/simple/
! cd EasyNLP 
! python setup.py install

使用如下命令验证是否安装成功:

! which easynlp

这里我的EasyNLP安装是没有安装成功的,尝试了两次,安装了两个多小时还是一样的结果

image.png

下面按照程序继续进入数据准备

数据准备

下载用于本示例的训练和测试集,并创建保存模型的文件夹

! wget http://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/generation/cn_train.tsv
! wget http://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/generation/cn_dev.tsv

数据下载完成后,可以通过以下代码查看第一条数据

print('Training data sample:')
! head -n 1 cn_train.tsv
print('Development set data sample:')
! head -n 1 cn_dev.tsv

后续可以继续参考官方文档的步骤逐步操作下去即可。

DSW-Gallery使用感受

建议

在使用过程中,个人觉得能在DSW的实例中内置好EasyNLP安装的安装内容呢?这里按照操作文档逐步执行安装EasyNLP的过程真的很痛苦,单说从git拉文件以及执行! pip install就持续了一个多小时,实在是太磨炼人的耐心了,最尴尬的是好不容易都安装完成之后验证EasyNLP是否安装成功时,验证命令返回 no EasyNLP;因此个人强烈建议DSW实例可以内置EasyNLP,这样对于提升用户体验,帮助用户更快掌握DSW Gallery操作一定会大有助益的。

日常应用

通过预览案例,在DSW实例中快速启动案例,或将案例修改为适合自己的使用场景。通过DSW Gallery,丰富的案例和解决方案可提升研发的效率和质量,帮助新手快速完成模型构建和训练。在日常工作中博文提取摘要,以及公众号,媒体文件等提取核心内容等,在这个自媒体,不单是视频也包括文本的时代,应用的场景会越来越广泛,伴随着DSW Gallery后续功能的不断优化,操作的不断简单化,功能会越来越强大,也会越来越普适化,祝DSW Gallery越来越好

最后,更多玩转云产品,点击进入:https://click.aliyun.com/m/1000370361/




相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
6月前
|
存储 人工智能 前端开发
EasyPhoto+PAI-DSW体验世界名画AIGC写真创作
基于阿里云人工智能PAI产品快速启动EasyPhoto,实现低代码开发个性化AI真人写真,打造属于自己的完美照片,玩转AIGC世界名画的新创作。
|
11月前
|
安全 测试技术 Go
ONE-FOX新款工具箱内测来袭,带给你不一样的体验~
ONE-FOX新款工具箱内测来袭,带给你不一样的体验~
1391 0
|
1月前
|
人工智能
阿里云AI作画工具免费体验
阿里云AI作画工具免费体验
204 0
|
3月前
|
人工智能 数据安全/隐私保护 Windows
分享我平时使用的几款免费的 AI 文字生成图片的在线网站
分享我平时使用的几款免费的 AI 文字生成图片的在线网站
167 0
|
11月前
|
小程序 开发者
欢迎体验精致1010
嗨,你好。欢迎你的到来,我是这款小游戏的开发者,小蚂蚁。 在这个一切都讲求快的时代,在所有的游戏都在想尽一切办法吸引玩家注意力,保持玩家留存率的环境下,我想通过这款游戏表达一些不一样的东西。
102 0
|
弹性计算 Java 关系型数据库
体验不错
我是一名电子信息工程的本科生,目前是大四在读,想要学习Linux操作系统以及部署自己的项目,在云服务器和虚拟机中反复横跳,最后选择了云服务器,因为阿里云在业界享有盛誉,故选择了阿里云,查找有无学生优惠时了解到了“飞天加速计划·高校学生在家实践”活动,因此参加次实践活动
|
弹性计算 Shell Linux
EXS体验
通过学生认证获得了一台ECS服务器,安装了docker部署微服务项目,在性能方面获得了很好的体验.
131 0
|
Web App开发 IDE Linux
ChromeOS 体验
ChromeOS 是后发的桌面级操作系统,它的 UI 是现代化的。在诞生之处,ChromeOS 目标是可以在廉价的设备上流畅运行,因此流畅度没有问题。最后,ChromeOS 内核基于 Linux,且系统相对封闭,在专用设备上稳定性应该有所保证(FydeOS for PC 这种无法面向一大类机器的发行版,无法保证稳定性)。 ChromeOS 系统层面,通过虚拟机技术,提供了具有独立内核的 Linux 子系统。 ChromeOS 就是对 Chrome 浏览器的操作系统化的产品,浏览器的体验毋庸置疑。
901 0
|
弹性计算 安全 前端开发
我的体验
服务器使用
110 0
|
存储 弹性计算 固态存储
esct体验心得
云服务器,是一种简单高效,处理能力可以弹性伸缩的计算服务。