带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(3)

简介: 带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(3)

带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(2) https://developer.aliyun.com/article/1246903?groupCode=taobaotech



在Unilm框架中,前一层的输出通过参数矩阵,,线性映射到(querys),(keys),(values)元组,隐层矩阵决定当前词语对是否可以互相“关注”。最后计算出self-attention head:


image.png


tricks:


Unilm模型通常以“字”作为基本输入单元,因为“字”的数据规模小、意义丰富, 模型泛化能力更强。但是, 我们在实验中发现中文内容生成常常会遇到生成不完整的问题,如“秋冬季新款女装,宽松直筒休闲裤,显瘦,修身,不起球,不掉” 这里应该是不掉色, 我们使用了“字”作为基本单元, 模型泛化能力强了, 但是生成效果有所下降。因此,我们构建了结合“字”与“词”的模式, 使得输入embedding变短,处理速度更快, 同时在文本生成任务上, 缓解了Exposure Bias问题。词义的不确定性更低,降低建模复杂度, 提升生成质量。


实验结果评估


我们在调研了多个业界内容生成工具评估指标后,结合淘宝Push智能生成业务总结了以下几个方面的评估指标:


1.表达相关性。主要看生成内容是否与切题,是否与用户输入标签相关。该指标可借鉴机器翻译常用评估指标BLEU进行评估。BLEU计算生产文本与关键词中共同n-gram数量计算两者相似度。


image.png


2.表达通顺性。生成内容是否通顺,是否与人工生成内容质量齐平。该指标主要通过人工评估文案质量,构建相应质量打分模型进行评估。


3.表达创新性,评估生成内容与训练样本的重合度。其中,与表达丰富度对应的主题相关 n-gram多样性实验结果如下。(M*代表不同模型,bs表示beam search的beam大小),数字越大表示内容丰富度越高。


image.png



带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(4) https://developer.aliyun.com/article/1246901?groupCode=taobaotech


相关文章
|
存储 缓存 负载均衡
Tair分布式缓存
Redis很好用,相比memcached多了很多数据结构,支持持久化。但是在很长一段时间里,原生是不支持分布式的。后来就出现了很多redis集群类产品,Tair是其中胜出的优秀作品之一。 所以Tair的特性都是一些集群的特性,比如:容错、解决单点故障、跨机房管理、多集群管理、支持副本等。总而言之,是redis的高可用版本。
2050 1
Tair分布式缓存
|
开发者 Python 设计模式
用 Python 轻松创建图形界面:Tkinter 入门指南
用几行Python代码就能创建桌面小工具?没错!tkinter是Python内置的GUI库,无需安装,跨平台支持。从窗口、按钮到弹窗,轻松实现图形界面交互,适合新手快速上手,打造专属小工具。#Python #tkinter
342 0
|
10月前
|
人工智能 机器人 API
小学生泪目Agent开发古诗助手
本文介绍了如何开发一个帮助小学生背古诗的AI Agent。通过阿里云的百炼大模型平台和千问,实现从需求规划、环境准备到开发与测试的全过程。该Agent不仅能根据主题找古诗、提供作者介绍和练习题,还能生成符合诗意境的图片,使学习更有趣。此外,还展示了如何通过无代码方式在百炼平台上构建智能体应用,简化开发流程。希望这能为学习AI Agent开发提供有益参考。
325 19
|
8月前
|
人工智能 API 决策智能
还在蹲Manus的邀请码?别等了!开源版Manus为你快速创建AI工位,给AI一台电脑,然后你就玩去吧!
OpenManus 是 MetaGPT 的开源 AI 平台,支持多语言模型和工具链,执行代码、处理文件等任务,具备实时反馈。OWL 基于 CAMEL-AI,支持角色分配、任务分解和记忆功能,实现高效任务自动化。
1122 22
还在蹲Manus的邀请码?别等了!开源版Manus为你快速创建AI工位,给AI一台电脑,然后你就玩去吧!
|
9月前
|
监控 容灾 Java
系统稳定性建设三件事
本文分享了作者学习稳定性工作、构建思路、落实方案,面对问题不断反思再推进的经验总结。
系统稳定性建设三件事
|
算法 程序员
程序设计的五个步骤
程序的设计过程,并不是立刻就进行代码设计,一般来讲包括设置文件的存放位置、说明书的设计、代码设计、程序测试、程序调试、注释说明。
1049 6
|
10月前
|
人工智能 搜索推荐 数据挖掘
Agent 从想法到实现之六顶思考帽
本文简要介绍六顶思考帽的概念及其优势,讲解智能体的概念和智能体平台,讲解该智能体的创建过程,带领大家从想法走向实现。
288 16
|
机器学习/深度学习 自然语言处理 监控
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8)
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8)
264 0
|
新零售 安全 Linux
阿里巴巴正式开源自研容器技术Pouch
阿里巴巴正式开源了基于Apache 2.0协议的容器技术Pouch。Pouch是一款轻量级的容器技术,拥有快速高效、可移植性高、资源占用少等特性,主要帮助阿里更快的做到内部业务的交付,同时提高超大规模下数据中心的物理资源利用率。
7983 1
|
数据采集 自然语言处理 算法
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(2)
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(2)
280 0