带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(1) https://developer.aliyun.com/article/1246888?groupCode=taobaotech
在推荐主链路的召回、排序和机制策略中,我们引入了若干算法策略来提升推荐内容的多样性降低系统的马太效应,但这部分优化主要是在存量内容上生效,对于新发布的内容则依赖于冷启动系统的加速。每平每屋的冷启动链路先后经历了从基于汤普森采样的定坑展现到基于Visual EE的动态混排策略迭代。但是,随着内容供给速度的提升,有限的冷启动流量难以满足新发内容的快速透出和潜在优质内容的快速成长诉求。本文将介绍我们在冷启动系统采用两阶段多级流量放大策略和内容潜力预估模型的实践经验。
冷启动系统优化
我们将新内容的冷启动分为了两个阶段:
1. 均匀保量
2. 助推放大
均匀保量阶段的目标为缩短新内容首曝时间并确保能够公平地获取曝光机会。而助推放大阶段的目标是帮助内容快速成长,符合条件的新内容从当天分配的固定流量池互相竞争获取流量,潜在的优质内容将会在这个阶段快速获取到一定的曝光数量,加快其成长速度。
由于新内容缺少线上的反馈数据,直接复用主链路的召回排序算法会导致对新内容的预估结果偏差较大,所以我们为冷启动链路设计了一套独立的召回排序链路。为了在缺少反馈数据的条件下尽可能将潜在优质内容排序靠前,我们还设计了一个内容潜力预估模型,并将该模型的预测分用在召回和排序算法中。冷启动链路的推荐结果会结合主链路结果和调控分数进行生成式重排,最终确定冷启动内容是否在当次请求中展示以及展示在第几个坑位。
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(3) https://developer.aliyun.com/article/1246886?groupCode=taobaotech