带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(6) https://developer.aliyun.com/article/1246899?groupCode=taobaotech
文案内容排序与商品推荐排序任务类似,都是对单一候选序列经过特征工程、模型构建拟合样本分布预测是否点击该Push。因此文案排序可以抽象为文案点击率预估模型,以曝光的文案内容、商品基本信息、用户信息为输入样本,预测目标为用户是否点击。商品推荐排序关注商品本身以及端内用户与商品交互信息,而文案排序阶段已有明确投放目标,因此文案优选层更关注当前内容的文风是否符合用户偏好以及是否突出用户关注“卖点”。以下列用户浏览商品轨迹为例:
1. 【旗舰店】森海塞尔MOMENTUM真无线二代主动降噪蓝牙耳机官网
2. sony索尼wf1000xm4真无线蓝牙主动降噪耳机入耳式降噪豆1000xm3
3. B&O Beoplay EQ真无线蓝牙主动消噪耳机入耳式运动耳塞bo降噪豆eq
4. Bose博士消噪耳塞真无线蓝牙降噪耳机麦主动降噪运动耳机大鲨鱼鳍
5. .....
可以看到该用户浏览的商品中均出现了“降噪”属性,如果模型能够学习到用户这一偏好,选择突出该“卖点”的文案曝光,对吸引用户点击一定有提升作用。因此我们在设计模型时主要考虑用户文案风格偏好、“卖点”偏好信息的提取。模型输入特征由三部分组成:
1. 商品基础特征,主要是商品一级类目、二级类目、叶子类目、商品标题内容切分等等。
2. 文案特征,主要由文案内容切分、文案来源、关键属性信息等等组成,
3. 用户特征,由一般社会学统计特征、用户端内行为特征、长短期类目偏好特征、浏览行为序列组成。这里用户浏览序列特征与一般构造商品浏览序列不同,序列内部主要突出商品文案以及属性信息。模型主体结构如下:
为了提升模型捕获文案风格信息的能力,我们在base结构基础上加入了文案self-Attention结构,并通过用户的浏览商品的文案属性序列增强模型对Push场景下用户个性化偏好信息以及场景上下文信息的学习。同时,其他诸如商
品基础类目信息、用户偏置信息映射为Embeddding向量一并拼接到模型输入。
小结
本节从智能文案生成项目一期上线后遇到的种种困难出发,阐述了我们从智能文案生成模块升级到淘宝Push文案层链路所做的一系列工作,并重点叙述了我们在文案层链路设计、数据处理模块升级、物料库建设、排序模型优化探索等等几个重要节点的工作细节。文案层链路建设促进了淘宝Push整体商品个性化文案质量提升,取得线上点击率效果平均提升10.03%的成果。
带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(8) https://developer.aliyun.com/article/1246897?groupCode=taobaotech