带你读《2022技术人的百宝黑皮书》——淘宝Push智能文案生成(7) https://developer.aliyun.com/article/1246898?groupCode=taobaotech
总结
本文主要介绍了2021年笔者在智能文案生成项目所做的工作。首先,基于淘宝Push存在的文案多样性低、创作成本高、缺乏统一沉淀等等问题设计并实现了智能文案生成模块、沉淀优质文案素材。模板话术生成模块通过挖掘模板、精准匹配方式生成高质量候选文案,关键字生成模块以淘宝Push历史数据为样本训练模型生成风格各异的文案内容,为运营同学创作素材提供灵感。而文案库搜索模块为运营同学预估文案质量提供数据依托。在项目上线后遇到调用量不够、数据回收困难等问题后,考虑自有素材文案生成方向,将现有模块升级为淘宝Push文案层链路,进一步完善文案生成能力并沉淀文案物料库,其中文案物料库已推广至同组其他项目中。而针对Push场景的文案层排序模型优化进一步提升了个性化商品推荐素材点击,提升了文案多样性和丰富度。
当然,现有工作还存在很多不足,比如内容生成模型仍然是离线训练方式,而作为整个链路的一部分生成模型无法感知文案质量对最终点击的影响,后续我们将致力于探索在线生成对抗学习在淘宝Push智能文案生成的应用,将线上反馈传播到生成模型本身,以提升生成模型对Push场景用户偏好语义风格的学习能力。另外,淘宝Push本身是一个非常大的对外投放通道,所受到的外部关注相对更高,不良Push文案所产生的舆情风险影响不可估量。而内容生成模型存在的解码不可控问题也限制了智能文案大范围推广,敏感词实时监控反馈、生成模型解码控制是我们接下来要优化的主要方向之一。
参考文献
团队介绍
我们是来自淘宝智能部的用户增长算法团队,团队定位于为淘宝平台用户运营业务提供算法服务,我们的工作内容包括RTA/RTB站外广告投放、新客潜客站内承接、PUSH推送优化、权益智能分发等。我们是一支正在快速成长中的学习型团队,在计算广告/推荐引擎/运筹优化/自然语言处理等算法领域深耕多年,创造业务价值的同时也关注个人技术成长,欢迎感兴趣的小伙伴加入。简历投递至kena.gkn@alibaba-inc.com