带你读《2022技术人的百宝黑皮书》——无尽流场景优化总结(4)

简介: 带你读《2022技术人的百宝黑皮书》——无尽流场景优化总结(4)

带你读《2022技术人的百宝黑皮书》——无尽流场景优化总结(3) https://developer.aliyun.com/article/1246800?groupCode=taobaotech



模型选择&样本构建


在模型选择中,考虑到目前无尽流场景样本量不多,无法训练太复杂的模型,经过评估后使用W&D进行训练【1】。对于样本构建,不同于点击率模型通过判断用户是否点击构造样本,无尽流下拉模型主要通过用户是否有继续下拉行为构建正负样本,并根据场景特点不断优化样本:


v1: 基于用户是否愿意继续下拉,将有继续下拉行为的样本认为是正样本,无继续下拉的样本认为是负样本;


v2: 基于“完全无下拉行为用户,用户意图不明确(干扰模型训练)”,剔除完全无下拉行为用户样本,剔除的无下拉用户行为样本占总样本量的24%;


v3: 基于“用户可能并不是因为最后一个浏览的内容跳失”,认为用户下拉序列中,后面浏览的内容都有可能是导致用户跳失,将最后10%下拉的内容都作为负样本;


模型离线AUC


image.png


线上AB


image.png


结论:从离线AUC看,v2版本效果最好,相比v1提高了将近0.01,v3版本效果不如v1;


从线上完整AB7天指标情况对比,v3版本下拉深度(人均曝光和次均曝光)提升较大,但其点击类指标收益负向;整体看v2版本表现最好,在下拉深度指标有提升情况下,点击类指标也有不错提升;因此,我们基于v2版本方式进行样本构建,并进行了其他优化;



带你读《2022技术人的百宝黑皮书》——无尽流场景优化总结(5) https://developer.aliyun.com/article/1246798?groupCode=taobaotech

相关文章
|
文字识别 算法 计算机视觉
关键帧提取 | 学习笔记
快速学习关键帧提取,介绍了关键帧提取系统机制, 以及在实际应用过程中如何使用。
关键帧提取 | 学习笔记
|
机器学习/深度学习 人工智能 供应链
如何正确的提问,获得最有效的回答帮助?
如何提高程序员的工作效率? 如何在云计算中实现智能化? 如何使用人工智能技术改善医疗保健行业? 如何保护个人隐私在数字化时代? 如何应对人工智能带来的就业变革? 如何构建高可靠性的云计算系统? 如何使用区块链技术改善供应链管理? 如何实现可持续的数字化转型? 如何使用机器学习技术预测未来趋势? 如何构建安全可靠的物联网系统?
827 1
|
运维 前端开发 Cloud Native
程序员如何行稳致远
作为一名在IT行业摸爬滚打了13年的资深程序员,一路走来吃过很多亏。对于程序员在职业生涯中有哪些关键事件,我做了以下几点总结,希望对你有所启发,让你少走弯路。
|
存储 C++
Tutorial 7 TLM2.0-lab1
[https://www.doulos.com/httpswwwdouloscomknowhow/systemc/tlm-20/tutorial-1-sockets-generic-payload-blocking-transport/]1、介绍:需要有SystemC的现有知识。2、模型概念SystemC的TLM重点是通过函数调用方式来实现SC进程间通信。OSCI TLM-2.0实际聚焦在片上存储
1193 0
|
存储 SQL 缓存
云原生数据仓库TPC-H第一背后的Laser引擎大揭秘
作者| 魏闯先阿里云数据库资深技术专家
1073 0
云原生数据仓库TPC-H第一背后的Laser引擎大揭秘
|
安全 Java 调度
Java多线程——Thread Runnable源码解析
Java多线程的两种实现方法大家都应该知道了:继承Thread的子类实例化和实现Runnable接口用这个接口实现类去创建Thread实例。 Java的线程在Linux平台上使用的是NPTL机制,JVM线程跟内核轻量线程(LWP)一一对应。
1521 0
|
5天前
|
云安全 人工智能 安全
AI被攻击怎么办?
阿里云提供 AI 全栈安全能力,其中对网络攻击的主动识别、智能阻断与快速响应构成其核心防线,依托原生安全防护为客户筑牢免疫屏障。