开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):自然语言生成技术介绍与应用】
课程地址:https://edu.aliyun.com/course/3112108/lesson/19281
自然语言生成技术介绍与应用
内容介绍:
一、文本标签生成技术介绍与应用
二、文本摘要生成技术介绍与应用
三、智能创作技术介绍与应用
一、文本标签生成技术介绍与应用
1.文本标签生成技术与实现方法介绍
(1)定义
生成的标签在一定程度上能够体现文本内涵;
是文本检索、文档比较、摘要生成、文档分类和聚类等文本挖掘研究的基础性工作;
(2)实现方法
采用计算权重的方式从候选集合中得到文本标签;
主要包括词性、词频、逆向文档频率、相对词频、词长等。
文本标签是一段文本通过人工智能的方式从里面找到自动生成的文字标签,要求生产的标签在一定程度上能够体现文本的内涵,文本标签生成是文本挖掘领域的一个分支,是文本检索、文档比较、摘要生成、文档分类还有聚类等等挖掘工作的基础工作,比如学习自然语言处理真有趣,在这个文本中自然语言处理词就可以被认为是文本的标签,标签一定程度上能够表现出文本的含义,比如接下来要做文本分类的任务,可以根据标签因为语言处理可以算是科学类别的信息,文本也可以分到科学的类里。
文本标签的实现方法里面比较重要的是计算权重,因为是采用计算权重的方式来得到文本标签,有一段文本,原文本要经过预处理得到候选标签的集合,然后经过计算得到候选标签的权重,选取权重较高的标签,得到文档的标签,计算权重要考虑的因素主要包括词性,是名词、动词、形容词,还有词频,词出现的频率,比如文档整篇都是跟自然语言处理有关系,自然语言处理可能出现的频率就会高一点,逆文档频率是存在其他文档出现的频率,如果逆文档频率比较高标签的重要性就会弱一点,还有一些相对磁频、磁场等等都是考虑的因素。
2.文本标签生成技术的应用场景
首先是个性化推荐,个性化推荐指的是通过分析挖掘用户行为,发现用户的个性化需求与兴趣,然后将用户可能感兴趣的信息或者商品推给用户,与搜索引擎不一样,个性化推荐系统不需要用户准确描述自己的需求,而是根据用户的历史行为进行建模,主动提供用户的兴趣和需求的信息。
文本标签生成系统能够通过对文章的标签计算,结合用户画像,精准的对用户进行个性化的推荐。标签生成技术另一个应用场景是主题聚合,可以认为文本标签生成是一个分类的过程,通过文本标签去计算主题,然后再做主题聚合会简单很多,如果是相同主题的标签就更简单,所以可以根据生成的标签,标签相同就是相同主题的标签文本,再推荐给用户,用户就可以很及时很方便去查阅同一主题下所有的文本。
二、文本摘要生成技术介绍与应用
1.文本摘要生成技术与实现方法介绍
定义:自动生成含原文本中重要信息的新文本内容;
目标:通过机器自动输出简洁、流畅、保留关键信息的摘要。
阿里云河北省教育脱贫云计算初级认证工程师培训是阿里云基于与河北教育厅签署的关于河北省贫困大学生云计算人才培养合作协议,为河北省建档立卡的贫困大学生提供免费的云计算培训及初级工程师认证考试。该活动获得了河北省教育厅及众多高校的大力支持......
文本摘要生成
培养一个人,帮助一个家,云计算技术赋能梦想与未来
文本摘要生成的定义是自动生成含原文本中重要信息的新文本内容,摘要概念比较好理解,写论文的时候要写摘要,新闻报纸可以写摘要,用简单的一段话,一小段文字来表述整个文本里面的重要内容,新闻是阿里云的新闻,是阳光网报道的阿里云在河北的教育脱贫、云计算认证培训、签订合作协议、提供免费的工程学认证考试,然后摘要可以写成培养一个人,帮助一个家庭,计算技术赋能梦想与未来,要有一定的文学水平才能写得出来,通过这个大概了解摘要的概念,研究文本摘要生成技术是因为文本信息是爆发成长的,人们每天能接触到海量的文本信息,新闻,博客,聊天,报告论文等,人是处理不过来的,怎样让机器去做自动摘要的生成是有要求的,要通过机器自动的输出,简洁流畅还要保留关键字的摘要,生成摘要可以用深度神经网络,用生成式的文本摘要去做,生长式的模型会有更强的表征,理解和生成文本的能力,而传统的方法是很难实现这种能力的,因为借助深度神经网络,生成式自动文本摘要也有了令人瞩目的发展,有了很多生长神经网络模型。
2. 文本摘要生成的应用场景
文本摘要生成有非常多的应用场景,如自动报告生成、新闻标题生成、搜索结果预览等,自动报告生成,为用户提供个性化定制生成报告服务。新闻标题生成,快速抽取核心内容摘要,节约阅读时间成本。
搜索结果预览,提供搜索结果的内容预览缩图,帮助用户更快地找到所需的信息。
文本摘要有很多的应用场景,比如自动报告生成,新闻标记生成,搜索结果预览。首先是自动报告生成,自动分析报告系统能够给用户提供个性化定制的,包括报告上传的标题,统计分析的结果,文档结构,具体内容等等,实现了报告制作的流程管理自动化,符合用户的报告应用需求。
第二个方向是新闻标题的生成,随着移动互联网的迅速发展,网络中的新闻的资源是技术级的增长,为新闻生成一个直观体现新闻主题内容的标题很重要,可以让读者快速浏览新闻的内容,准确的选择自己感兴趣的内容,所以新闻标题生成系统能够快速的抽取核心内容摘要,然后显示给用户,节约阅读时间成本,可以给读者带来更好的阅读体验。
第三种场景是搜索结果预览,提供每条搜索结果预览的缩略图,帮用户很好的去找所需要的信息,过去用户一般是要靠搜索里面的标题还有页面的摘要,来确定哪些结果是符合要求的,通过快速预览能够通过内容预览缩图看到同样的效果。
三、智能创作技术介绍与应用
1.智能创作技术介绍
智能创作技术可以分为人工智能自动写作和人工智能辅助写作两类;具有作品制作高效、具有强大潜能、内容客观、节省人力成本等。
在人类写作的全流程中提供辅助功能,,帮助完成写作任务。
创作很难特别对于人工智能,能够用人工智能的自然语言处理技术让机器去进行创作是一件很有趣的事情,智能创作技术可以分为人工智能自动协作和人工智能辅助协作两类,人工智能自动写作是人工智能算法可以自主完成写作任务,不需要人去干预,写作是件很难很复杂的事情,是用语言、文字、符号来反映客观事物、是表达市场感情或者是传递信息知识,是创造性的脑力劳动,科学家已经把人工智能的尝试用在写作上面,来帮助人们去提升写作的效率和质量,用人工智能去协作做的作品很高效,比人快很多,有强大的潜能,内容客观,节省成本都是优势,创作系统可以帮创作者辅助去了解一些热点,新闻的线索,然后为选题提供灵感,还可以帮作者快速的查出文章,比如热点的写作,财经的写作,还有关于天气体育等领域的模板写作,有套路的写作,简单轻松,这种应该归到人工智能的辅助写作,相当于传信息告诉人工智能在写哪方面,根据模板自动的生成辅助写作。
2.智能创作技术的应用场景
智能写诗
根据关键词和格律自动生成诗词,具有多体裁、多风格、人机交互创作模式等特点。
智能春联
早在2018年就已经通过网络春晚的舞台推出,可通过关键词输入的方式生成春联,包括上联、下联和横批。
智能写诗人工智能根据关键词和格律自动的生成诗词,还可以有多题材多风格,人机交互等等来创作特点,有人认为人工智能写的已经超过人类,有人认为写出来的是生搬硬套,一看就知道是人工智能写的。还有一个应用场景是智能春联,在2018年网络晚会的舞台上推出来,通过关键词的输入来生成春联,上联下联横批都可以,智能创作是探索大于使用价值,探索的路上虽然不能真的去写诗,但是在自动的生成文本上面,技术已经得到了改进提升。
3.人工智能辅助写作的应用方法
写作有人工智能的帮助会容易很多,在写作之前经常要面临的问题是些什么,算法以通过分析当前的热点、话题、推荐名单去写,解决了选题困难不了读者需求的问题,选好热门话题接下来如何去写,面临的问题也是没有思路,缺乏资料,处理效率很低,人工智能可以去做素材推荐,帮忙把材料归纳起来,还可以去做写作时候的内容提示。当写作完成之后可能想写的更好一点,图文更丰富,没有字词错误,然后做漂亮的排版,人工智能可以帮忙去做智能纠错、自动的配图还可以自动的排版,通过这些工作来帮助完善写作的结果,写作完成并不是内容创作的终点,还要把内容提供给合适的用户和满足用户的需求,是写作完成最后的任务,还可以用算法为写作添加标签,方便通过个性化的推荐把内容推给感兴趣的用户。
3.本节回顾
通过本节的学习,我们学到了:
文本标签生成技术介绍与应用,生成的标签在一定程度上能够体现文本内涵。
是文本检索、文档比较、摘要生成、文档分类和聚类等文本挖掘研的基础性工作。
文本摘要生成技术介绍与应用,自动生成含原文本中重要信息的新文本内容。
能够通过机器自动输出简洁、流畅、保留关键信息的摘要。
智能创作技术介绍与应用,智能创作技术可以分为人工智能自动写作和人工智能辅助写作两类。
人工智能自动写作主要使用人工智能算法自主完成写作任务,不需要人工千预。
人工智能辅助写作主要在人类写作的全流程中提供辅助功能,帮助完成写作任务。