【电商搜索】现代工业级电商搜索技术-中科大-利用半监督学习改进非点击样本的转化率预测

简介: 【电商搜索】现代工业级电商搜索技术-中科大-利用半监督学习改进非点击样本的转化率预测

【电商搜索】现代工业级电商搜索技术-中科大-利用半监督学习改进非点击样本的转化率预测

0. 论文信息

RecSys24: Utilizing Non-click Samples via Semi-supervised Learning for Conversion Rate Prediction

@inproceedings{huang2024utilizing,

title={Utilizing Non-click Samples via Semi-supervised Learning for Conversion Rate Prediction},

author={Huang, Jiahui and Zhang, Lan and Wang, Junhao and Jiang, Shanyang and Huang, Dongbo and Ding, Cheng and Xu, Lan},

booktitle={Proceedings of the 18th ACM Conference on Recommender Systems},

pages={350–359},

year={2024}

}

利用半监督学习改进非点击样本的转化率预测

1. 摘要

这篇文章提出了一种新的半监督学习方法,称为非点击样本改进的半监督(NISE)方法,用于提高转化率(CVR)预测的准确性。该方法旨在解决样本选择偏差(SSB)、数据稀疏性(DS)和假阴性样本(FNS)问题,这些问题在推荐系统中进行CVR预测时尤为突出。通过将非点击样本视为未标记样本,并预测它们如果被点击可能会转化的概率,然后将这些概率作为伪标签用于进一步的模型训练。此外,文章还引入了一个辅助的点击通过率(CTR)预测任务,并通过多任务学习来增强嵌入层的表示。通过在多个真实世界数据集上的广泛实验,验证了该方法在减少FNS挑战和提高CVR估计准确性方面的优越性。

2. 研究背景

在推荐系统中,准确预测用户的转化率(CVR)对于匹配推荐项目和用户偏好至关重要。然而,由于样本选择偏差和数据稀疏性,以及假阴性样本问题,这一任务面临挑战。现有的方法通过多任务学习来解决这些问题,但这些方法可能会加剧假阴性样本问题。

3. 问题与挑战

  • 样本选择偏差(SSB):传统CVR模型在点击空间训练时,由于未随机选择的暴露但未点击样本,导致在整体空间推断时出现偏差。
  • 数据稀疏性(DS):与暴露样本相比,点击样本明显稀疏,导致模型难以拟合。
  • 假阴性样本(FNS)问题:由于CVR任务的反事实性质,非点击样本可能被视为负面,但未点击并不一定意味着用户不喜欢这些项目。

4. 如何解决

文章提出了NISE方法,该方法通过以下方式解决上述挑战:

  • 将非点击样本视为未标记,并预测它们如果被点击可能会转化的概率。
  • 将这些概率作为伪标签,用于半监督学习。
  • 引入CTR预测任务,并通过多任务学习增强嵌入层的表示。
  • 采用动态任务权重分配机制,以确保平衡和稳定的训练过程。

5. 创新点

  • 提出了一种新的半监督学习方法,通过预测非点击样本的转化概率并将其作为伪标签,以解决假阴性样本问题。
  • 引入CTR预测任务,并通过多任务学习提高模型的表示能力。
  • 设计了动态权重分配机制,以平衡CVR和CTR任务的训练。

6. 算法模型

NISE方法的核心是一个半监督学习框架,它结合了CTR和CVR任务,并使用动态权重分配策略。该方法在整体空间上建模,利用伪标签来处理非点击样本,并利用多任务学习来提高模型性能。

7. 实验效果

  • 在两个公共数据集和一个生产数据集上进行了实验,NISE方法在减少FNS挑战和提高CVR估计准确性方面优于五个最先进的基线方法。
  • 在Ali-CCP数据集上,NISE方法实现了1.11%的AUC相对增益,在Kuaipure数据集上实现了2.00%的AUC相对增益,在生产数据集上实现了0.70%的AUC增益。


8. 推荐阅读指数

★★★★☆

推荐理由

这篇文章提出了一种创新的半监督学习方法来改进CVR预测,特别是在处理非点击样本时。它不仅解决了样本选择偏差和数据稀疏性问题,还通过引入CTR任务和动态权重分配机制,有效地缓解了假阴性样本问题。这些贡献对于推荐系统领域的研究人员和实践者来说都是非常有价值的。

9. 小结

这篇文章通过引入半监督学习框架和多任务学习策略,有效地解决了推荐系统中的转化率预测问题,特别是在处理非点击样本时,提高了模型的准确性和鲁棒性。


后记

如果您对我的博客内容感兴趣,欢迎三连击(点赞、收藏、关注和评论),我将持续为您带来计算机人工智能前沿技术(尤其是AI相关的大语言模型,深度学习和计算机视觉相关方向)最新学术论文及工程实践方面的内容分享,助力您更快更准更系统地了解 AI前沿技术

相关文章
|
数据采集 机器学习/深度学习 搜索推荐
大模型开发: 描述主成分分析(PCA)以及它在降维中的应用。
PCA是广泛应用的降维技术,通过线性变换找到最大化方差的主成分,降低数据维度,简化计算并揭示数据结构。步骤包括数据预处理、计算协方差矩阵、特征值分解、选择主成分和数据转换。适用于图像识别、推荐系统等领域,但无监督性质可能导致类别信息丢失,且假设数据服从高斯分布。
605 1
|
自然语言处理 算法 数据挖掘
自蒸馏:一种简单高效的优化方式
背景知识蒸馏(knowledge distillation)指的是将预训练好的教师模型的知识通过蒸馏的方式迁移至学生模型,一般来说,教师模型会比学生模型网络容量更大,模型结构更复杂。对于学生而言,主要增益信息来自于更强的模型产出的带有更多可信信息的soft_label。例如下右图中,两个“2”对应的hard_label都是一样的,即0-9分类中,仅“2”类别对应概率为1.0,而soft_label
自蒸馏:一种简单高效的优化方式
|
机器学习/深度学习 自然语言处理 算法
什么是大模型
什么是大模型
2968 1
|
人工智能 小程序 机器人
GDC2025 | DeepSeek-Qwen 模型蒸馏极限挑战赛,来了!(预赛报名)
欢迎您关注由魔搭社区 x SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛!本赛事将作为2025全球开发者先锋大会(GDC)的活动之一,欢迎具备大模型训练/微调实战经验的独立开发者前来挑战!详细报名规则见后文。
397 3
|
数据采集 搜索推荐
推荐系统实践之新闻推荐baseline理解
推荐系统实践之新闻推荐baseline理解
483 1
|
设计模式 开发者 Python
深入理解Python适配器模式及其应用示例
在软件开发中,适配器模式是一种常用的设计模式,它可以帮助我们解决不兼容的接口或类之间的问题。通过适配器模式,我们可以简化不兼容接口之间的调用,并提高代码的复用性和可维护性。这两个支付接口具有不同的接口定义和调用方式,为了屏蔽这种差异性并实现统一的支付接口,可以使用适配器模式来完成。通过适配器模式,我们成功地将支付宝和微信支付的接口适配到了统一的支付接口上,实现了支付系统的可扩展性和灵活性。适配器模式的核心思想是创建一个中间层,将不同的接口进行适配,使得接口之间可以无缝衔接并协同工作。
268 2
|
机器学习/深度学习 自然语言处理 并行计算
【深度学习】Attention的原理、分类及实现
文章详细介绍了注意力机制(Attention)的原理、不同类型的分类以及如何在Keras中实现Attention。文章涵盖了Attention的基本概念、计算区域、所用信息、结构层次等方面,并提供了实现示例。
2232 0
|
机器学习/深度学习 缓存 自然语言处理
PyTorch使用Tricks:梯度裁剪-防止梯度爆炸或梯度消失 !!
PyTorch使用Tricks:梯度裁剪-防止梯度爆炸或梯度消失 !!
1507 0
|
机器学习/深度学习 人工智能 自然语言处理
NeurIPS’23 Paper Digest | 如何把 LLM 的推理能力应用于事件序列预测?
我们完成了首个把 LLM 推理能力引入事件序列领域的工作。代码、数据均已经开源,并将集成进开源库 EasyTPP。
NeurIPS’23 Paper Digest | 如何把 LLM 的推理能力应用于事件序列预测?
|
缓存 安全 Docker
Docker 部署Streamlit项目 | Streamlit如何部署到云服务器
Docker 部署Streamlit项目 | Streamlit如何部署到云服务器

热门文章

最新文章