基于GAN的个性化短标题生成在1688平台的实践应用

简介: 在电商情境下,卖家为了吸引买家兴趣,也为了提高商品被搜索引擎检索命中的概率,通常趋向于写过于冗长的商品标题。如何从过于冗长的标题中抽取关键信息作为短标题展示在手机端,同时结合不同用户的兴趣及用户特征,展示不同的短标题,是我们研究的核心。过去,1688导购场景中的短标题文案由卖家填写或仅通过简单的统计方法实现,基于此,我们运用算法的手段构建深度学习模型,并在1688平台的多个场景里尝试并落地了个性化短标题生成的技术,丰富了场景的营销内容,在场景中取得了不错的效果。

一、背景介绍

我们团队从去年的工作中,积累了风格化文案生成算法的内容生成方案。之后,我们创新的提出使用Generative Adversarial Network的生成技术,结合用户特征进行个性化短标题的生成,同时提高稀疏数据集下模型的鲁棒性。目前成果已被DLP-KDD2020会议录用,论文题目是“Selling Products by Machine: a User-Sensitive Adversarial Training method for Short Title Generation in Mobile E-Commerce”。

过去的相关研究主要从商品的内容出发,而缺少对用户行为的挖掘,从而忽视了买家的需求。我们提出了“个性化指针生成对抗网络(PPGAN)”,生成用户感知的个性化短标题。此外,在数据集上,电商用户行为数据中用户的低点击率使得我们的数据集非常稀疏,本文模型引入一种无监督的信息理论策略,能够从用户未点击数据中识别出高质量的短标题训练模型。

e13780340421439e8d58cdf48b2a80d8.png

二、模型结构

55b4d9b383ac485b85968bf3286aa620.png

PPGAN模型网络整体包含三个模块,1.电商词嵌入,2.个性化短标题生成器G,3.两种不同的判别器D:真假判别器和CTR判别器。这三个模块共同组成我们的个性化短标题生成模型框架。

1.电商词嵌入

我们使用AliNLP的电商NER工具对商品标题和用户特征进行识别,提取“颜色”、“风格”、“品类”等实体类型特征。例如,在商品标题“包邮Nike品牌的红色运动裤”中,“包邮”标记为“市场服务”,“Nike”标记为“品牌”,“红色”标记为“颜色”,“运动裤”标记为“品类”。对于每个单词,我们将其单词向量和NER向量拼接,共同作为模型的词向量输入。

对于商品标题序列,每个单词被表示成:

023496e12070461f877deda341105795.png

对于用户特征序列,每个单词被表示成:

0405ae1ca74d42ac9c6986a0d4cee83a.png

通过加入单词的NER信息,模型更能够学习到每个单词的重要性,将重要的单词保留在短标题中。

2. 个性化短标题生成器

对于短标题生成器来说,输入信息为商品标题和用户特征,通过one-step Pointer Networks模型从原标题中抽取式的生成短标题,与传统的多步指针网络相比,一步指针网络在解码阶段一步解码,避免了多步解码的重复性抽取问题。

用户特征的构建:我们基于用户在平台的点击记录运用统计方法计算用户特征,具体来说,对于用户点击过的商品item_t,收集点击itemt之前点击过的10个商品数据,通过词频统计取TOP10的单词作为用户特征U=(u_1, u_2, ... , u_10)。

如图所示,在用户特征构建后,将用户特征向量序列输入GRU网络中,计算得到用户表征。

83ffa4dd0ad141a19904cadc6323d30f.png

为了融合用户和被点击的商品的特征,我们将用户表征与商品词向量进行拼接,再输入GRU编码器进行编码。

c05239f96caf4f6a8465cb964a91829e.png

c13c64a9f081428999a5987b8c43e92b.png

在解码部分,通过基于注意力机制的一步解码和softmax层,输出在原输入序列上的概率分布,取概率TopK的单词作为生成的短标题。

dcc5023f422b40dab8ae65a9f9c48f04.png

b53d7d0c6d394f39994ae135a3a89373.png

3. 判别器

判别器D是一个以生成器G的输出分布Pg和真实短标题分布Pr为输入的二元分类器,用来判别是商家手写真实短标题还是机器生成的伪短标题。我们将真实短标题的输入分布定义如下,其中T为原始长标题,S=(s_1, s_2, ... , s_m)为真实短标题,m是短标题的长度。

e93a5d39f8144fb4989ef5210abf0dd8.png

同时,为了让判别器不那么容易的判别出真伪短标题,我们给真伪短标题的分布加入服从高斯分布的噪音,使训练过程更加稳定。

bd2af0fcf434432fbaa56436ec6a3eee.png

将这两个标题分布与商品词向量点乘得到“短标题”的向量表示,在拼接用户特征后分别输入判别器D进行判别。
判别器D网络采用常用的卷积神经网络,包括真假判别器和CTR判别器两种。真假判别器用来使生成器生成的短标题更接近用户点击的真实短标题;此外,考虑到数据集的稀疏性,用户点击样本量相对于未点击样本量较少,因此我们希望引入CTR判别器,从大量的用户未点击样本中识别高质量的短标题训练模型。

4. 对抗训练损失与模型训练过程

生成器G尽力为目标用户生成接近真实的短标题分布,判别器D尽力最大化真伪短标题分布之间的距离,从而做出正确判别。算法流程如下图所示:

998d9f918e754f3cbe5645e6355ac88d.png

  • 首先使用大量长短标题pair对预训练生成器G,快速更新我们的生成器。由于没有足够的用户点击数据覆盖所用商品,我们在预训练阶段仅使用商品标题特征,而不考虑用户特征。我们使用L2损失函数作为预训练生成器G时的损失:

    1a8f76cec38947cea569da8350feedbb.png

  • 正式训练阶段1,输入数据为用户点击的商品数据[T+, U+, S+],生成器G和真假判别器D的损失函数如下:

    39234649d2374de79c82ae3eea6183af.png

    9b4eef3e422941bc8ed20fab9a47a9ea.png

  • 正式训练阶段2,输入数据为用户未点击的商品数据[T-, U-]。事实上,用户未点击的短标题并不仅仅由于短标题质量不好,也可能是用户对商品本身不感兴趣。因此,我们考虑通过对抗的方式识别出用户未点击但质量好的短标题。我们借鉴了现有的工作,最大化正负例之间的信息边界,在判别器损失中加入正负两个类别之间的加性条件熵M_D(x)。CTR判别器的损失函数如下:

    748af142d8264e2a865f236c5e6f16a9.png

    a080749b04fa49cf9130f888cc3cf9d0.png

三、实验结果与线上效果

1. 样本数据和训练

我们的训练样本来自1688平台商家手写的短标题以及现有短标题场景中用户的行为数据,可以将数据集表示成,其中O为商品原始长标题,S表示手写短标题,U为用户特征序列,L为用户对商品的标签(1表示点击,0表示未点击),样例如下图所示。我们的用户点击样本量为64万,用户未点击样本量为695万,因此数据集较为稀疏。此外,数据样本上,经过了一定的数据清理工作,因为本身训练样本数据的质量会严重影响最终生成短标题的质量,我们的处理主要包括脏语料的剔除、异常字符的过滤、原始标题长度限制等,同时利用AliNLP进行用户和商品特征的命名实体识别工作。

数据样例如下:

c4ae05ee62294fefb2b14359cd4a3f71.png

2. 个性化短标题生成样例

与对比方法相比,我们的模型PPGAN能够根据不同的用户特征,从原始长标题中抽取特定用户感兴趣的信息生成个性化的短标题。表中短标题的生成长度设定为5,根据不同的产品和场景需求,我们能够生成不同长度的个性化短标题,从而让生成的短标题更贴合业务需求。

PPGAN实验生成样例如下图所示:

48be636c155844d784ec28dbff491de9.png

3. 1688落地效果

目前个性化短标题已落地到1688平台的多个场景中,包括伙拼、天天特卖、厂货集采等。我们在榜单的“发现好货”进行AB测试,结果上实时个性化短标题比截断长标题点击率绝对值高出2.3个点左右,比统计短标题高出1.7个点左右。并且在2019年的920大促中,全量上线到大促会场中,承接住1100+QPS的调用量,为1688导购场景全面赋能,目前已沉淀为场景侧技术工具,供运营使用。

线上效果如下:

55c86be6b8374efdbd5600cc85d4a5e3.png

四、参考文献

[1] Martin Arjovsky, Soumith Chintala, and Leon Bottou. 2017. Wasserstein Generative Adversarial Networks. In ICML. 214–223.
[2] Oriol Vinyals, Meire Fortunato, and Navdeep Jaitly. 2015. Pointer networks. In NIPS. 2692–2700.
[3] Tao Zhang, Jin Zhang, Chengfu Huo, and Weijun Ren. 2019. Automatic Generation of Pattern-controlled Product Description in E-commerce. In WWW. 2355–2365.
[4] Jiatao Gu, Zhengdong Lu, Hang Li, and Victor O K Li. 2016. Incorporating copying mechanism in sequence-to-sequence learning. In ACL. 1631–1640.
[5] Yue Deng, Yilin Shen, and Hongxia Jin. 2017. Disguise Adversarial Networks for Click-through Rate Prediction. In IJCAI. 1589–1595.

386ecdcbf98a403db932936d3adcd472.png

延伸阅读《阿里巴巴B2B电商算法实战》 点我购买
推荐语:本书是阿里巴巴CBU技术部(1688.com)深耕B2B电商15年的经验总结。阿里巴巴B2B在战略形态上经历了信息平台、交易平台和营销平台的升级迭代,本书聚焦营销平台商业形态背后的算法和技术能力,试图从技术和商业互为驱动的视角阐述技术如何赋能业务,并结合阿里巴巴集团在基础设域和算法创新上的沉淀,打造出智能B2B商业操作系统。
目录
相关文章
|
1月前
|
机器学习/深度学习 编解码 人工智能
AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
AI短视频制作一本通:文本生成视频、图片生成视频、视频生成视频
424 0
|
1天前
|
机器学习/深度学习 缓存 自然语言处理
采用ChatGPT大模型高效精准文档翻译
这款文档翻译工具支持PDF、Word、PPT、Excel和TXT等多种格式,利用ChatGPT大模型进行高效精准的翻译,覆盖30多种语言。它通过文档解析、预处理、翻译和结果合成步骤工作,并采用缓存、并行处理和负载均衡技术优化性能。该工具满足全球化背景下企业和个人的多语言需求,助力信息交流。
22 0
采用ChatGPT大模型高效精准文档翻译
|
1月前
|
机器学习/深度学习 自然语言处理 知识图谱
万字综述:2023年多模态检索增强生成技术(mRAG)最新进展与趋势-图片、代码、图谱、视频、声音、文本
综述多模态检索增强生成技术(mRAG)最新进展与趋势-图片、代码、图谱、视频、声音、文本。
|
7月前
|
自然语言处理 算法 PyTorch
一句话塑造一个3D形象,文本生成3D头部模型魔搭最佳实践
高保真 3D 人脸重建在许多场景中都有广泛的应用,例如 AR/VR、医疗、电影制作等。尽管大量的工作已经使用 LightStage 等专业硬件实现了出色的重建效果,从单一或稀疏视角的单目图像估计高精细的面部模型仍然是一个具有挑战性的任务。
|
10月前
|
算法 安全 测试技术
中文竞技场大模型体验报告
本次测评的主要目标是评估中文竞技场提供的大模型在写作创作相关、知识常识和代码相关方面的表现。我们进入“中文竞技场”体验了这些模型,并在以下方面进行了测试和评估。
200 30
|
10月前
中文竞技场大模型体验评测分析
中文竞技场大模型体验
406 0
中文竞技场大模型体验评测分析
|
1月前
|
人工智能 自然语言处理 机器人
NLP自学习平台中的文本摘要功能并不仅限于电商版
【1月更文挑战第20天】【1月更文挑战第100篇】NLP自学习平台中的文本摘要功能并不仅限于电商版
123 2
|
1月前
|
SEO
技术写作:漏斗内容策略、认知博客、支柱内容、研究报告、通用门控内容、电子书和教程
顶部漏斗是指客户旅程中的认知阶段,他们第一次接触到企业或产品。在这个阶段,他们意识到自己存在问题,并开始寻找信息或解决方案。此阶段的内容旨在通过提供与他们的问题相关的解决方案或有价值的信息来吸引潜在客户的注意力和兴趣。这种内容通常是广泛而丰富的,而不是针对产品的。其目的是在建立信任和品牌权威的同时,告知和教育受众。
84 5
|
1月前
|
搜索推荐 API 开发工具
技术写作与内容研究:主题得分、关键词搜索量、社区和论坛策略
内容研究涉及对特定主题进行系统的调查,以收集可靠和相关的信息。这个过程对于技术作者来说至关重要,因为它有助于生成有价值的、准确的、信息丰富的和引人入胜的内容。它超越了基本的互联网搜索,包括阅读技术文档、采访专家、进行调查和分析数据。内容研究应以战略方式进行,考虑信息的用途、目标受众和要传达的关键信息。一个执行良好的内容研究过程可以帮助技术作者生成既清晰又简洁的高质量内容。
46 2
|
9月前
|
自然语言处理 人工智能
中文竞技场大模型测评后续之模型自动对话
中文竞技场大模型测评延续中,模型自动对话场景测评
534 0
中文竞技场大模型测评后续之模型自动对话