淘宝粗排问题之在粗排模型中引入交叉特征如何解决

简介: 淘宝粗排问题之在粗排模型中引入交叉特征如何解决

问题一:离线hitrate提升幅度与线上A/B test中hitrate提升幅度的一致性如何?


离线hitrate提升幅度与线上A/B test中hitrate提升幅度的一致性如何?


参考回答:

离线hitrate提升幅度与线上A/B test中hitrate提升幅度的一致性取决于多种因素。场景内提升幅度离在线必定不同,因为精排候选集分布的变化会影响最终指标。场景外提升幅度也可能不同,这取决于场景外转化到场景内的情况以及在线生效问题。如果场景外提升幅度相同且没有转化到场景内,则需要进一步分析粗排后续阶段对粗排新召回商品的认可程度。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/654794



问题二:蒸馏样本的进一步扩充是如何进行的 ? 会遇到哪些问题?


蒸馏样本的进一步扩充是如何进行的 ? 会遇到哪些问题?


参考回答:

蒸馏样本的进一步扩充主要包括三种尝试:单独添加引入M个未曝光样本的蒸馏、去掉base中的pv distill loss增加一个N+M+K的蒸馏、保留base的蒸馏loss并添加一个N+M+K的蒸馏。

在尝试过程中,会遇到:

一是随机负样本中的未曝光样本的精排分数可能会高于曝光样本,二是未曝光商品的后验P(海选->曝光)=0,难以直接表征从海选到点击的概率。通过分析和实验,最终发现保留base蒸馏loss并添加一个N+M+K的蒸馏方案效果最好。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/654795



问题三:为什么需要引入更多的特征到粗排模型中?


为什么需要引入更多的特征到粗排模型中?


参考回答:

引入更多的特征到粗排模型中是为了进一步加强粗排模型的表达能力,并提高与精排模型的一致性。这些特征主要包括用户画像特征和用户的长期成交序列,它们能帮助粗排模型更准确地建模用户侧信息。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/654796



问题四:如何尝试在粗排模型中引入交叉特征?


如何尝试在粗排模型中引入交叉特征?


参考回答:

为了向粗排模型中引入交叉特征,我们在原有的Item Tower和User Tower的基础上引入了Cross Tower。Cross Tower的输出向量与User侧向量计算内积,并与原有的内积结果相加得到最终的计算结果。然而,在离线和在线实验中,加入交叉特征并未带来显著的效果提升。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/654797



问题五:为什么从内积模型结构切换到MLP结构没有带来预期的效果提升?


为什么从内积模型结构切换到MLP结构没有带来预期的效果提升?


参考回答:

从内积模型结构切换到MLP结构并没有带来预期的效果提升,可能是因为MLP结构需要更多的特征输入才能发挥其优势,而在粗排场景下,由于性能和效率的限制,无法引入过多的特征。此外,MLP结构本身也可能不适合粗排阶段的特点。


关于本问题的更多回答可点击原文查看:

https://developer.aliyun.com/ask/654798

相关文章
|
Java Spring
spring框架之AOP模块(面向切面),附带通知类型---超详细介绍
spring框架之AOP模块(面向切面),附带通知类型---超详细介绍
340 0
|
机器学习/深度学习 人工智能 自然语言处理
一文搞懂【知识蒸馏】【Knowledge Distillation】算法原理
一文搞懂【知识蒸馏】【Knowledge Distillation】算法原理
一文搞懂【知识蒸馏】【Knowledge Distillation】算法原理
|
机器学习/深度学习 人工智能 算法
顶会论文 | 阿里云视频摘要 SOTA 模型:用于视频摘要的多层时空网络
这次向大家分享的工作是作者所负责团队在国际人工智能多媒体顶会 ACM MM 2022 (CCF-A)发表的文章 “Multi-Level Spatiotemporal Network for Video Summarization”,该文提出了一种用于视频摘要的多层时空网络,在视频摘要领域实现了全球领先的研究探索。基于作者团队在工业级推荐系统方面的研究积累,成功地在阿里云产业大规模视频摘要场景实践中解决了一个视频摘要领域的重要问题,推动了该领域的发展。
3671 1
顶会论文 | 阿里云视频摘要 SOTA 模型:用于视频摘要的多层时空网络
|
新零售 人工智能 Cloud Native
【年度重磅】阿里淘系全年技术总结黑皮书,1500页免费下载!
淘系技术将2020一整年的精华内容梳理合并,重磅推出【淘系技术2020技术年货】。在这本书中,你将看到:各技术栈下时新前沿的技术讲解与方法技巧、淘系技术大牛的职场成长经验&学习问答实录、年度精选技术人员必读书单、淘系经典开源项目介绍、2020淘系顶会 paper 全文。
47562 0
【年度重磅】阿里淘系全年技术总结黑皮书,1500页免费下载!
|
搜索推荐
淘宝粗排问题之引入未曝光样本和随机负样本对粗排模型有何影响,如何解决
淘宝粗排问题之引入未曝光样本和随机负样本对粗排模型有何影响,如何解决
|
11月前
|
机器学习/深度学习
阿里妈妈首提AIGB并实现大规模商业化落地,将在NeurIPS 2024正式开源Benchmark
阿里妈妈提出AI-Generated Bidding(AIGB)新范式及DiffBid生成式竞价模型,突破传统基于强化学习的自动竞价方法局限。AIGB将自动竞价视为生成问题,通过捕捉复杂依赖关系,提升长期规划和随机环境中的稳定性和效果。DiffBid基于条件扩散建模,灵活生成满足特定目标的竞价轨迹,显著提升GMV和ROI。实验结果表明,DiffBid实现了2.81%的GMV增长和3.36%的ROI增长。然而,生成式建模的复杂性也带来了训练和调优的挑战。 论文链接:https://arxiv.org/abs/2405.16141
511 9
|
机器学习/深度学习 自然语言处理 搜索推荐
承上启下:基于全域漏斗分析的主搜深度统一粗排
两阶段排序(粗排-精排)一开始是因系统性能问题提出的排序框架,因此长期以来粗排的定位一直是精排的退化版本,业内的粗排的优化方向也是持续逼近精排。我们提出以全域成交的hitrate为目标的全新指标,重新审视了召回、粗排和精排的关系,指出了全新的优化方向
94376 3
|
机器学习/深度学习 监控 搜索推荐
深度粗排模型的GMV优化实践:基于全空间-子空间联合建模的蒸馏校准模型
随着业务的不断发展,粗排模型在整个系统链路中变得越来越重要,能够显著提升线上效果。本文是对粗排模型优化的阶段性总结。
2186 0
深度粗排模型的GMV优化实践:基于全空间-子空间联合建模的蒸馏校准模型
|
搜索推荐 测试技术 流计算
承上启下:基于全域漏斗分析的主搜深度统一粗排
文章首先介绍了淘宝搜索的多阶段检索系统,包括召回、粗排和精排阶段。粗排模型的目标是优化商品的排序,以提高在召回集合中选择优质商品的能力。文章提到,粗排模型与精排模型的目标有所不同,粗排更注重腰部商品的排序,而精排更注重头部商品的排序。 此外,文章还探讨了模型的损失函数形式,发现原始的softmax损失函数在处理多正样本时存在问题,提出了改进的损失函数,使得模型在粗排阶段的表现更佳。最后,作者们总结了优化工作的进展,以及优化样本对齐,以实现更好的整体效果。
淘宝粗排问题之对粗排阶段打分集合归因到对应的场景内和场景外成交如何解决
淘宝粗排问题之对粗排阶段打分集合归因到对应的场景内和场景外成交如何解决

热门文章

最新文章