SIGIR21 | 购物篮推荐场景太复杂?没有商品相关性标签?对比学习去噪解决(二)

简介: SIGIR21 | 购物篮推荐场景太复杂?没有商品相关性标签?对比学习去噪解决(二)

三、CLEA算法流程


4b1a8a14938c2c5744e7f1abe6301744.png


四、实验结果


在四个真实的数据集上进行了实验。对于每一个用户,都随机采用了1000个负样本,然后在groud-truth基础上对这些负样本进行排序。


HN)HFXJBFRROSOYSJF2$@35.png


模型采用四个评估指标:Recall@K、Precision@K、F1@K和NDCG@K


c8efcd85216440d251265519f3f84794.png


对比结果:表明了这种hard把序列分成正负序列的做法,比attention那种softmax进行加权求和的方法要更好。以及,对比学习的两阶段训练比联合训练好。


五、总结


基本的序列推荐方法,是把所有的历史行为通过RNN、GRU等序列模型融合成固定长度的embedding,然后进行预测;但是用户行为的随机和多样性导致不是所有的行为都有助于下一个物品预测的,所以进一步有基于attention的方法,这类方法基本思路就是用过softmax加权求和的方式削弱历史不相关物品的影响,但是仍然保留了一些噪声。


因此本文提出了一种通过用对比学习进行有效的去噪,并且取得了SOTA的效果,是一篇非常值得精度的论文。

相关文章
|
2月前
|
自然语言处理 数据挖掘
数据特征包括分布特征、统计特征、对比特征、帕累托特征和文本特征
数据特征包括分布特征、统计特征、对比特征、帕累托特征和文本特征
95 4
|
6月前
|
算法 vr&ar Python
R语言隐马尔可夫模型HMM连续序列重要性重抽样CSIR估计随机波动率模型SV分析股票收益率时间序列
R语言隐马尔可夫模型HMM连续序列重要性重抽样CSIR估计随机波动率模型SV分析股票收益率时间序列
|
6月前
Stata广义矩量法GMM面板向量自回归 VAR模型选择、估计、Granger因果检验分析投资、收入和消费数据
Stata广义矩量法GMM面板向量自回归 VAR模型选择、估计、Granger因果检验分析投资、收入和消费数据
|
6月前
|
机器学习/深度学习
【视频】R语言LDA线性判别、QDA二次判别分析分类葡萄酒品质数据|数据分享(下)
【视频】R语言LDA线性判别、QDA二次判别分析分类葡萄酒品质数据|数据分享
|
6月前
|
机器学习/深度学习 算法 数据可视化
【视频】R语言LDA线性判别、QDA二次判别分析分类葡萄酒品质数据|数据分享(上)
【视频】R语言LDA线性判别、QDA二次判别分析分类葡萄酒品质数据|数据分享
|
6月前
|
机器学习/深度学习 算法
R语言隐马尔可夫模型HMM识别不断变化的股票市场条件
R语言隐马尔可夫模型HMM识别不断变化的股票市场条件
|
6月前
|
存储 Python
t-sne方法:观察类别区分度
背景:一个二分类任务。 目的:尝试使用t-sne方法,观察这两个类别是否是可分的。
52 0
|
6月前
|
机器学习/深度学习 XML 编解码
ENVI实现最小距离法、最大似然法、支持向量机遥感图像监督分类与分类后处理操作
ENVI实现最小距离法、最大似然法、支持向量机遥感图像监督分类与分类后处理操作
292 1
|
6月前
|
机器学习/深度学习 编解码 自动驾驶
【论文速递】WACV2022 - 基于小样本分割的多尺度Non-Novel片段消除方法
【论文速递】WACV2022 - 基于小样本分割的多尺度Non-Novel片段消除方法
|
机器学习/深度学习 自然语言处理 算法
【网安AIGC专题11.1】11 Coreset-C 主动学习:特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)
【网安AIGC专题11.1】11 Coreset-C 主动学习:特征选择+11种采样方法+CodeBERT、GraphCodeBERT+多分类(问题分类)二元分类(克隆检测)非分类任务(代码总结)
201 0