带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(1) https://developer.aliyun.com/article/1246845?groupCode=taobaotech
相关工作
带着上述问题,我们调研了一些具备上下文感知能力的个性化重排方法。
DLCM[8]和PRM[9]分别使用GRU和Transformer结构对候选列表中内容的特征进行提取从而得到每个内容在考虑了上下文相互影响和列表整体信息的预估分,按预估分对候选列表中的内容进行重排序。这类方法虽然简洁高效,但重排序后的列表每个内容的上下文已经发生了改变,即内容参与打分时的上下文与最终内容展现时的上下文并不一致。
miRNN[10]和Seq2slate[11]分别使用RNN和PointerNetwork通过对列表中已选中内容对当前内容的影响进行建模来逐个生成展现列表中的内容。这类方法能够确保打分时的上下文和最终展现给用户时候内容的上下文一致,但在生成每个内容时无法考虑到后续内容对该内容的影响,即对上下文信息的建模并不充分。
EG-Rerank[12]和GRN[13]提出将将重排拆解成由序列生成和序列评估组成的两阶段任务,来实现保持打分上下文与展现上下文一致以及充分建模内容上下文信息从而实现列表整体收益最大化的目标。下面介绍我们在每平每屋频道中应用生成式重排的方案。
技术方案
序列生成
在序列生成环节,出于整体系统链路性能的考虑,我们采用了若干不同的启发式策略并行产生兼顾效率目标与多样性目标的候选列表。
MMR
MMR是一种启发式的多样性算法,其在产生推荐列表每个位置内容时会同时考虑当前内容的相关性和当前内容与前序已选内容中最相似的内容的相似度。
为候选内容集合, 为已选中内容集合, 为内容i的相关性分, 为内容i和内容j的相似度分, 为平衡因子, 越小生成的列表多样性越高,我们使用不同的超参数 产生了若干组候选列表。
带你读《2022技术人的百宝黑皮书》——生成式重排在内容推荐中的应用实践(3) https://developer.aliyun.com/article/1246843?groupCode=taobaotech