带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(3) https://developer.aliyun.com/article/1246886?groupCode=taobaotech
流量扶持效率
助推放大阶段引入了分级流量放大机制,将用于冷启扶持的流量更多倾斜到潜在优质内容,加速优质内容成长。我们采用近7天冷启链路曝光的内容在最近1天常规链路分发下的pctr衡量扶持效率。具体公式定义为:
内容潜力预估模型
模型设计
我们设计内容潜力预估模型来预测新发布的内容在未来成长为热门内容的概率。模型以内容是否能成为热门为目标,将在发布7天内迅速获得高曝光高点击的内容为正样本,其余为负样本。通过模型训练,捕获内容成长为热门的特征,从而挖掘出有潜力的内容。
特征工程
在特征选择上,主要分为2类:内容属性特征和内容封面图特征。其中,内容属性特征包括:内容所属的风格、空间,挂载商品的id、类目、店铺、组合价格等。通过一个预训练的模型提取对应的封面图图像embedding特征。值得注意的是,我们有意识地避开点击率等基于用户交互行为的统计特征,以期更专注于内容本身进行潜力预估。
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(5) https://developer.aliyun.com/article/1246883?groupCode=taobaotech