带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(4)

简介: 带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(4)

带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(3) https://developer.aliyun.com/article/1246886?groupCode=taobaotech



流量扶持效率


助推放大阶段引入了分级流量放大机制,将用于冷启扶持的流量更多倾斜到潜在优质内容,加速优质内容成长。我们采用近7天冷启链路曝光的内容在最近1天常规链路分发下的pctr衡量扶持效率。具体公式定义为:


image.png


image.png


image.png


内容潜力预估模型


模型设计


我们设计内容潜力预估模型来预测新发布的内容在未来成长为热门内容的概率。模型以内容是否能成为热门为目标,将在发布7天内迅速获得高曝光高点击的内容为正样本,其余为负样本。通过模型训练,捕获内容成长为热门的特征,从而挖掘出有潜力的内容。


特征工程


在特征选择上,主要分为2类:内容属性特征和内容封面图特征。其中,内容属性特征包括:内容所属的风格、空间,挂载商品的id、类目、店铺、组合价格等。通过一个预训练的模型提取对应的封面图图像embedding特征。值得注意的是,我们有意识地避开点击率等基于用户交互行为的统计特征,以期更专注于内容本身进行潜力预估。



带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(5) https://developer.aliyun.com/article/1246883?groupCode=taobaotech

相关文章
|
SQL Java 关系型数据库
若依框架---PageHelper分页(十一)
若依框架---PageHelper分页(十一)
378 0
|
28天前
|
机器学习/深度学习 缓存 算法
解密Qwen3三连发:强化学习新算法GSPO!
强化学习(RL)是提升语言模型推理与问题求解能力的关键技术。然而,现有算法如 GRPO 在长期训练中存在严重不稳定性,限制了性能提升。为此,我们提出 **Group Sequence Policy Optimization (GSPO)**,通过在序列层面定义重要性比率并进行优化,显著提升了训练效率与稳定性。GSPO 在 MoE 模型训练中表现出色,无需依赖复杂策略即可实现高效训练,简化了 RL 基础设施。该算法已成功应用于 Qwen3 系列模型,推动 RL scaling 边界,释放模型潜能。
193 0
|
Shell Python
什么是 PYTHONPATH?
【8月更文挑战第29天】
1220 1
|
搜索推荐
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(6)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(6)
241 0
|
数据采集 缓存
【MODBUS】Modbus设备与云平台对接的方式
【MODBUS】Modbus设备与云平台对接的方式
514 0
|
搜索推荐 算法
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2)
309 1
|
机器学习/深度学习 智能设计 自然语言处理
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(7)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(7)
389 0
|
人工智能 安全 机器人
新手必看!ChatGPT常见问题总整理,你遇到了几个?
新手必看!ChatGPT常见问题总整理,你遇到了几个?
|
搜索推荐 流计算
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(3)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(3)
202 0