作者:阅谦
出品:大淘宝技术
本系列文章包含每平每屋过去一年在召回、排序和冷启动等模块中的一些探索和实践经验,本文为该专题的第三篇。
第一篇指路:冷启动系统优化与内容潜力预估实践
第二篇指路:GNN在轻应用内容推荐中的召回实践
前言背景
淘宝内的每平每屋频道是每平每屋业务获取C端流量并进行内容分发从而建立用户家居、生活方式心智场的主要阵地。在每平每屋频道中,内容主要以场景搭配为主,内容内挂载了多个商品锚点,点击商品锚点可以跳转到商品的详情页。
一直以来,我们结合业务特点利用算法技术提升用户浏览体验、流量分发效率和整体的系统生态。其中排序环节的迭代优化对于提升系统的分发效率至关重要,如下图展示在模型结构和样本特征两方面我们进行了大量的尝试和优化工作,但在模型训练方式的升级上进展缓慢。
在电商搜推等用户行为和环境不断变化的场景中,在线学习能够显著提高模型对于线上流量分布变化响应速度,但整个流程相比于离线学习会复杂很多,这其中包括实时曝光点击数据的收集,实时特征采集,流式样本生成,模型实时训练和更新等流程,这些流程环环相扣,既需要保证逻辑正确性还需要保证时效性。
带你读《2022技术人的百宝黑皮书》——基于特征全埋点的精排ODL实践总结(2) https://developer.aliyun.com/article/1246867?groupCode=taobaotech