带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(2)

简介: 带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(2)

智能文案生成算法


话术模板生成模块(模板生成)


模板生成主要依赖人工处理数据、构建模板,成本较高。由于上线时间紧凑和资源限制等问题,我们采用NLP工具挖掘模板的方式构造初版模板。这种处理方式的主要动机是运营创作文案时,通常包含一些基本属性,比如时间季节、人群、地点、活动、利益点等等,如: 一大波#品类#来袭,#人群#健康饮食....可以通过内容聚合技术挖掘这类具有统一属性的话术模板。因此话术模版生成的主要处理流程总结如下:


image.png


将获取到的Push文案数据经过低质内容过滤、删除重复项、统一规格等方式进行数据清洗,然后通过AliNLP平台提供的各类自然语言处理工具识别出文案中的关键属性,利用统一占位符${风格}、${人群受众}、${材质}等等内容填充,设定阈值过滤阈值对内容进行数据聚合,最终生成模板。


image.png

关键字生成模块(模型生成)


模型生成部分主要分为两大类,营销类Push文案以及商品个性化Push文案。由于计算资源有限,利用预训练好的模型框架,在此基础上进行fine tuning是现阶段工业界内容生成常用的做法。我们调研对比了包括Bert、Unilm、GPT等等使用范围较广的内容生产框架。简单介绍如下,Bert及其衍生的各类算法框架以Transformer为基础, 通702过Masked部分内容, 学习全局信息更新参数, 该类模型更适合于文本理解相关工作。Unilm作为Bert衍生模型通过Position Embedding+单向Masked方式突破Bert内容生成质量不佳的限制。而GPT是主结构为self-Attention的单向语言模型,模型参数超过15亿、训练耗时长,其离线对比生成效果与Unilm不相上下。因此,最终我们选择了Unilm作为基础框架。同时使用Push文案样本数据作为输入对模型进行fine tuning。模型框架如下:


image.png



相关文章
|
11月前
|
人工智能 自然语言处理 安全
新浪微博AIGC业务应用探索-AIGC应用平台助力业务提效实践
本次分享围绕AIGC技术在新浪微博的应用展开,涵盖四个部分。首先分析AIGC为微博带来的机遇与挑战,特别是在内容安全和模型幻觉等问题上的应对策略;其次介绍通过工程架构快速实现AIGC技术落地的方法,包括统一部署模型和服务编排;接着展示AIGC在微博的具体应用场景,如评论互动、视频总结和智能客服等;最后展望未来,探讨大模型的发展趋势及其在多模态和特定业务场景中的应用前景。
|
10月前
|
人工智能 弹性计算 JSON
AI大模型复习“搭子”—部署流程演示
本文主要介绍文档智能,介绍利用大模型构建知识库和AI学习助手的部署流程,主要包括以下几方面的内容: 1.什么是文档智能 2.文档智能 & RAG 3.基于文档智能和百炼平台的RAG应用案例
338 3
|
数据采集 XML JSON
「Python入门」Python代码规范(风格)
**Python编码规范摘要** - 编码:使用UTF-8编码,文件开头可声明`# -- coding: utf-8 --`。 - 分号:避免在行尾使用,不用于分隔命令。 - 行长:不超过80字符,长表达式可使用括号换行。 - 缩进:使用4个空格,禁止混用tab。 - 注释:行注释始于`#`和空格,块注释和文档注释遵循特定格式。 - 空行:函数和类定义间用2空行,方法间1空行,内部适当空行。 - 空格:运算符两侧各空一格,逗号后空格,括号内不空格。 - 命名:模块小写,变量下划线分隔,类驼峰式,布尔变量前缀`is_`。 - 引号:保持一致性,可使用单引号或双引号。
1494 1
「Python入门」Python代码规范(风格)
|
机器学习/深度学习 人工智能 搜索推荐
用AI技术打造个性化新闻推荐系统
【10月更文挑战第7天】本文将介绍如何使用AI技术构建一个个性化的新闻推荐系统。我们将从数据收集、处理,到模型训练和优化,最后实现推荐系统的全过程进行讲解。通过这篇文章,你将了解到如何利用机器学习和深度学习技术,为用户提供精准的新闻推荐。
413 0
|
机器学习/深度学习 人工智能 数据可视化
📊数据说话,AI领航:精准分析,让职场决策从此有据可依!
【8月更文挑战第1天】在数据驱动的职场中, AI助力精准决策。
270 0
|
人工智能 自然语言处理 搜索推荐
|
机器学习/深度学习 自然语言处理 达摩院
如何用一套语音识别系统实现多语种混合自由说?
语音识别技术,也被称为自动语音识别 (Automatic Speech Recognition,ASR),其目标是将语音转成文字。
1585 0
如何用一套语音识别系统实现多语种混合自由说?
|
机器学习/深度学习 自然语言处理 监控
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8)
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8)
264 0