DSW-Gallery使用体验+生成吸引人眼球的新闻标题

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 本文利用EasyNLP进行模型构建、训练、评估、预测生成中文新闻标题,介绍如何在PAI-DSW中使用EasyNLP

在实操上手操作之前,首先需要确认一下相关的专业名词的定义。

什么是EasyNLP

官方文档中定义:EasyNLP是PyTorch中易于使用的NLP开发和应用工具包,它采用可扩展的分布式训练策略构建,并支持适用于各种NLP应用的一整套NLP算法。集成了知识蒸馏和few-shot learning,用于落地大型预训练模型。

什么是mT5

官方定义是:T5是由谷歌提出的一个序列到序列预训练模型,它将不同的生成任务进行统一,在兼顾迁移性的前提下取得了文本生成领域的最佳性能。mT5是T5的多语言版本,该模型利用包含101种语言的语料训练得到多语言预训练模型。

在EasyNLP中,我们提供了经过训练的mT5(其它模型可见列表),以便用户能够受益于模型强大的建模能力。该模型是在mT5的基础上利用新闻数据进行微调得到。本文将以生成吸引人眼球的新闻标题为例,将mT5作为模型底座构建标题生成模型,展示如何利用EasyNLP进行模型构建、训练、评估、预测。

生成吸引人眼球的新闻标题

机器学习PAI体验地址:https://click.aliyun.com/m/1000370361/

开通机器学习PAI服务

如果没有开通机器学习PAI,那么你需要先开通

image.png

点击【免费开通并创建默认工作空间】

image.png

确认之后会出现弹窗提示,

image.png

我们选择【去授权】,进入到授权页面

image.png

点击【同意授权】之后,再次回到开通页面点击确认按钮,会看到【等待...】的提示

image.png

等待之后就显示开通成功

image.png

生成新闻标题

点击机器学习PAI首页的DSW Gallery,找到【基于EasyNLP的中文新闻标题生成】

image.png

创建DSW实例

点击【在DSW中打开】,这时会弹出页面选择实例

image.png

这里如果DSW实例没有可选项的话,点击选择框下面的【这里】跳转到创建DSW实例页面。

image.png

输入自定义实例名称,这里选择GPU P100 60GB的资源

image.png

镜像选择PAI-Pytorch 1.7/1.8镜像,这样创建的DSW实例才符合基于EasyNLP的中文新闻标题生成 所需要的环境要求

image.png

点击【确认订单】跳转到确认页面

image.png

再次确认实例信息后勾选协议点击【创建实例】完成创建。

EasyNLP安装

后续参考操作内容进行EasyNLP安装

! git clone https://github.com/alibaba/EasyNLP.git
! pip install -r EasyNLP/requirements.txt -i http://mirrors.aliyun.com/pypi/simple/
! cd EasyNLP 
! python setup.py install

使用如下命令验证是否安装成功:

! which easynlp

这里我的EasyNLP安装是没有安装成功的,尝试了两次,安装了两个多小时还是一样的结果

image.png

下面按照程序继续进入数据准备

数据准备

下载用于本示例的训练和测试集,并创建保存模型的文件夹

! wget http://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/generation/cn_train.tsv
! wget http://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/generation/cn_dev.tsv

数据下载完成后,可以通过以下代码查看第一条数据

print('Training data sample:')
! head -n 1 cn_train.tsv
print('Development set data sample:')
! head -n 1 cn_dev.tsv

后续可以继续参考官方文档的步骤逐步操作下去即可。

DSW-Gallery使用感受

建议

在使用过程中,个人觉得能在DSW的实例中内置好EasyNLP安装的安装内容呢?这里按照操作文档逐步执行安装EasyNLP的过程真的很痛苦,单说从git拉文件以及执行! pip install就持续了一个多小时,实在是太磨炼人的耐心了,最尴尬的是好不容易都安装完成之后验证EasyNLP是否安装成功时,验证命令返回 no EasyNLP;因此个人强烈建议DSW实例可以内置EasyNLP,这样对于提升用户体验,帮助用户更快掌握DSW Gallery操作一定会大有助益的。

日常应用

通过预览案例,在DSW实例中快速启动案例,或将案例修改为适合自己的使用场景。通过DSW Gallery,丰富的案例和解决方案可提升研发的效率和质量,帮助新手快速完成模型构建和训练。在日常工作中博文提取摘要,以及公众号,媒体文件等提取核心内容等,在这个自媒体,不单是视频也包括文本的时代,应用的场景会越来越广泛,伴随着DSW Gallery后续功能的不断优化,操作的不断简单化,功能会越来越强大,也会越来越普适化,祝DSW Gallery越来越好

最后,更多玩转云产品,点击进入:https://click.aliyun.com/m/1000370361/




相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
8月前
|
人工智能 vr&ar
AIGC领域又有大动作了!AI视频“黑马”Morph Studio 来袭,1080P高清画质视频免费生成!
AIGC领域又有大动作了!AI视频“黑马”Morph Studio 来袭,1080P高清画质视频免费生成!
207 2
|
存储 人工智能 前端开发
EasyPhoto+PAI-DSW体验世界名画AIGC写真创作
基于阿里云人工智能PAI产品快速启动EasyPhoto,实现低代码开发个性化AI真人写真,打造属于自己的完美照片,玩转AIGC世界名画的新创作。
|
人工智能 自然语言处理 Java
首次体验中文竞技场大模型体验!!!
我将分别从知识常识、中文游戏、NLP专业领域、代码相关、写作创作、人类价值观六大领域测评不同模型的效果,以及一些看法。
|
安全 测试技术 Go
ONE-FOX新款工具箱内测来袭,带给你不一样的体验~
ONE-FOX新款工具箱内测来袭,带给你不一样的体验~
2033 0
|
10天前
|
人工智能 自然语言处理
AI生成海报 or 人工手绘 ,哪个更好
AIGC(人工智能生成内容)正引领智能化转型的浪潮,涵盖文字、图片、音频等多种形式。AI生成海报以其速度快、设计酷炫、创意无限和成本低等优势脱颖而出,尤其适合中小企业和个人。相比人工手绘海报虽富有情感和温度,但耗时较长且成本较高,AI生成海报更显高效便捷。两者各具特色,但在快节奏的今天,AI生成海报无疑是更省时省力的选择。
|
12天前
|
人工智能 Java Maven
【体验有奖】SoFlu - JavaAI 开发助手邀您来体验啦!
嘿,技术达人们!SoFlu - JavaAI开发助手帮你摆脱繁琐的基础开发任务,通过引导式开发、AI智囊和一键工程构建,缩短开发周期,优化设计。参与体验还有惊喜好礼相送!快来加入我们,轻松搞定编程,专注解决复杂问题和优化用户体验。期待你的加入!
|
2月前
|
人工智能 搜索推荐 小程序
无广告,直达结果的AI搜索引擎
在信息海洋中寻找知识,却常被广告和无关结果困扰?秘塔AI搜索能完美解决这些问题。它无广告、直达结果,全网搜索内容提炼整合,并提供思维导图、相关事件及参考来源,让你高效获取精准答案。快来体验吧![访问地址](https://metaso.cn/)
171 6
无广告,直达结果的AI搜索引擎
|
3月前
|
Serverless 数据安全/隐私保护 前端开发
大模型代码能力体验报告之贪吃蛇小游戏《一》:Claude.ai篇 - 生成、预览和快速部署的serverless一条龙
本文介绍了通过Claude.ai生成并优化Web版贪吃蛇游戏的过程,展示了其强大的代码生成功能及用户友好的界面设计。从初始版本的快速生成到根据用户反馈调整游戏速度,再到提供多种实用工具如文件管理、版本控制和一键部署,Claude.ai不仅是一个代码助手,更像是一个全面的serverless开发平台。文中还呼吁国内厂商关注此类技术的发展。
仿网易官网顶部展出的大幅广告代码,附效果演示
仿网易官网顶部展出的大幅广告代码,附效果演示
|
人工智能 搜索推荐 安全
用AI制作游戏应用高点击率图标!
用AI制作游戏应用高点击率图标!
276 0