推荐系统去流行度偏差(bias)文献四篇

简介: 推荐系统去流行度偏差(bias)文献四篇

Keeping Dataset Biases out of the Simulation : A Debiased Simulator for Reinforcement Learning based Recommender Systems. (RecSys 2020)


作者为了解决历史数据中的用户与项目之间存在的两种交互偏差:选择偏差和流行度偏差,提出在构造“用户-项目”评级矩阵之前执行去偏差的步骤。由于选择偏差和流行度偏差,导致历史记录中用户对项目的评级是有选择性的,所以依照历史数据构造的评级矩阵的稀疏性不是随机存在的,作者在模拟选择偏差时,对用户更可能喜欢的项目进行声明,使它有更高概率被用户评级,在模拟流行度偏差时,对流行度高的项目进行声明,使它有更高概率被用户评级。然后根据模拟数据拟合出用户选择某一物品的概率,再利用IPS方法对项目评级进行重要性加权以实现去偏。


Popularity-Opportunity Bias in Collaborative Filtering (WSDM 2021)


作者从两个角度看待流行度偏差产生的影响:对用户的影响以及对推荐项的影响。其中对用户的影响是推荐系统会优先推荐高流行度的项目,同样可能被用户所喜欢的低流行度项目被推荐的机会更少;对推荐项的影响是低流行度的推荐项会越来越不受重视,最终偏差累计会使得推荐系统被流行的项目主导。作者提出了后处理方法和内处理方法来缓解流行度偏差。后处理方法是对低流行度的项目施加补偿,给它更高的得分从而获得与高流行度项目相似的排名。内处理方法是将流行度与项目推荐解耦,利用皮尔逊相关系数的平方作为正则化项,然后通过最小化正则化项和推荐误差来降低偏差。


Analyzing Item Popularity Bias of Music Recommender Systems: Are Different Genders Equally Affected? (RecSys 2021)


作者为了量化研究流行度偏差的特征,提出了七种指标来度量流行度偏差:平均值、中位数、方差、偏斜度、峰态系数、KL散度、肯德尔系数。其中。平均值、中位数用于表现推荐项流行度与实际流行度的总体趋势;方差用于表示历史记录与推荐列表之间多样性的变化;偏斜度、峰态系数用于表示推荐项目与实际选择项目两种分布之间的形状差异;KL散度、肯德尔系数在量化了推荐项目与实际选择项目两种分布之间的相似程度。同时作者研究了音乐推荐系统中流行度偏差与用户特征之间的关系,结论是不同性别的用户受到流行度偏差的影响是不同的,女性用户更容易受到流行度偏差的影响。


Diverse User Preference Elicitation with Multi-Armed Bandits. (WSDM 2021)


作者流行度偏差会影响到推荐的多样性,因此提出了一种基于Multi-armed Bandit的方法同时提高项目多样性和主题多样性。该方法对每个用户独立运行一个Bandit,然后对可能存在的主题各用一个Arm控制,每次迭代时选择值最高的一个Arm所控制的主题,将该主题内包含的所有项根据与当前用户偏好的多样性进行降序排序,再从排序后的项目列表中选择推荐项,作者称为引出项。由于引出项本身可能同时属于多个主题,所以该方法同时保证了主题多样性和项目多样性。


相关文章
|
数据挖掘
生信教程:使用拓扑加权探索基因组进化(1)
生信教程:使用拓扑加权探索基因组进化(1)
111 1
|
数据可视化 Python
生信教程:使用拓扑加权探索基因组进化(3)
生信教程:使用拓扑加权探索基因组进化(3)
83 0
|
5月前
|
机器学习/深度学习 数据可视化 算法
深入浅出:可视化理解揭示决策树与梯度提升背后的数学原理
本文将通过视觉方式解释用于分类和回归问题的决策树的理论基础。我们将看到这个模型是如何工作的,以及为什么它可能会导致过拟合。首先将介绍梯度提升以及它是如何改善单个决策树的性能的。然后将用Python从头实现梯度提升回归器和分类器。最后详细解释梯度提升背后的数学原理。
84 3
深入浅出:可视化理解揭示决策树与梯度提升背后的数学原理
|
6月前
|
机器学习/深度学习 数据采集 算法
Python实现ISSA融合反向学习与Levy飞行策略的改进麻雀优化算法优化支持向量机分类模型(SVC算法)项目实战
Python实现ISSA融合反向学习与Levy飞行策略的改进麻雀优化算法优化支持向量机分类模型(SVC算法)项目实战
|
8月前
|
机器学习/深度学习 自然语言处理 决策智能
8分SCI | 揭示随机森林的解释奥秘:探讨LIME技术如何提高模型的可解释性与可信度!
8分SCI | 揭示随机森林的解释奥秘:探讨LIME技术如何提高模型的可解释性与可信度!
339 1
|
8月前
|
机器学习/深度学习 数据采集 自然语言处理
【热门话题】常见分类算法解析
本文介绍了6种常见分类算法:逻辑回归、朴素贝叶斯、决策树、支持向量机、K近邻和神经网络。逻辑回归适用于线性问题,朴素贝叶斯在高维稀疏数据中有效,决策树适合规则性任务,SVM擅长小样本非线性问题,KNN对大规模数据效率低,神经网络能处理复杂任务。选择算法时需考虑数据特性、任务需求和计算资源。
125 0
|
8月前
|
机器学习/深度学习 算法 vr&ar
强化深度学习中利用时序差分法中的Sarsa算法解决风险投资问题实战(附源码 超详细必看)
强化深度学习中利用时序差分法中的Sarsa算法解决风险投资问题实战(附源码 超详细必看)
87 0
|
机器学习/深度学习 算法 知识图谱
浙大团队将化学知识引入机器学习,提出可外推、可解释的分子图模型预测反应性能
浙大团队将化学知识引入机器学习,提出可外推、可解释的分子图模型预测反应性能
231 0
|
机器学习/深度学习 自然语言处理 算法
少样本学习综述:技术、算法和模型
少样本学习(FSL)是机器学习的一个子领域,它解决了只用少量标记示例学习新任务的问题
820 0
谷歌、DeepMind新研究:归纳偏置如何影响模型缩放?
谷歌、DeepMind新研究:归纳偏置如何影响模型缩放?