推荐系统去流行度偏差(bias)文献四篇

简介: 推荐系统去流行度偏差(bias)文献四篇

Keeping Dataset Biases out of the Simulation : A Debiased Simulator for Reinforcement Learning based Recommender Systems. (RecSys 2020)


作者为了解决历史数据中的用户与项目之间存在的两种交互偏差:选择偏差和流行度偏差,提出在构造“用户-项目”评级矩阵之前执行去偏差的步骤。由于选择偏差和流行度偏差,导致历史记录中用户对项目的评级是有选择性的,所以依照历史数据构造的评级矩阵的稀疏性不是随机存在的,作者在模拟选择偏差时,对用户更可能喜欢的项目进行声明,使它有更高概率被用户评级,在模拟流行度偏差时,对流行度高的项目进行声明,使它有更高概率被用户评级。然后根据模拟数据拟合出用户选择某一物品的概率,再利用IPS方法对项目评级进行重要性加权以实现去偏。


Popularity-Opportunity Bias in Collaborative Filtering (WSDM 2021)


作者从两个角度看待流行度偏差产生的影响:对用户的影响以及对推荐项的影响。其中对用户的影响是推荐系统会优先推荐高流行度的项目,同样可能被用户所喜欢的低流行度项目被推荐的机会更少;对推荐项的影响是低流行度的推荐项会越来越不受重视,最终偏差累计会使得推荐系统被流行的项目主导。作者提出了后处理方法和内处理方法来缓解流行度偏差。后处理方法是对低流行度的项目施加补偿,给它更高的得分从而获得与高流行度项目相似的排名。内处理方法是将流行度与项目推荐解耦,利用皮尔逊相关系数的平方作为正则化项,然后通过最小化正则化项和推荐误差来降低偏差。


Analyzing Item Popularity Bias of Music Recommender Systems: Are Different Genders Equally Affected? (RecSys 2021)


作者为了量化研究流行度偏差的特征,提出了七种指标来度量流行度偏差:平均值、中位数、方差、偏斜度、峰态系数、KL散度、肯德尔系数。其中。平均值、中位数用于表现推荐项流行度与实际流行度的总体趋势;方差用于表示历史记录与推荐列表之间多样性的变化;偏斜度、峰态系数用于表示推荐项目与实际选择项目两种分布之间的形状差异;KL散度、肯德尔系数在量化了推荐项目与实际选择项目两种分布之间的相似程度。同时作者研究了音乐推荐系统中流行度偏差与用户特征之间的关系,结论是不同性别的用户受到流行度偏差的影响是不同的,女性用户更容易受到流行度偏差的影响。


Diverse User Preference Elicitation with Multi-Armed Bandits. (WSDM 2021)


作者流行度偏差会影响到推荐的多样性,因此提出了一种基于Multi-armed Bandit的方法同时提高项目多样性和主题多样性。该方法对每个用户独立运行一个Bandit,然后对可能存在的主题各用一个Arm控制,每次迭代时选择值最高的一个Arm所控制的主题,将该主题内包含的所有项根据与当前用户偏好的多样性进行降序排序,再从排序后的项目列表中选择推荐项,作者称为引出项。由于引出项本身可能同时属于多个主题,所以该方法同时保证了主题多样性和项目多样性。


相关文章
|
8天前
|
机器学习/深度学习 自然语言处理 算法
【模式识别】探秘判别奥秘:Fisher线性判别算法的解密与实战
【模式识别】探秘判别奥秘:Fisher线性判别算法的解密与实战
85 0
|
5月前
|
机器学习/深度学习 算法 数据可视化
深度解读DBSCAN聚类算法:技术与实战全解析
深度解读DBSCAN聚类算法:技术与实战全解析
791 0
|
7月前
|
机器学习/深度学习 数据挖掘
R实战|从文献入手谈谈logistic回归、Cox回归以及Lasso分析(一)
R实战|从文献入手谈谈logistic回归、Cox回归以及Lasso分析(一)
420 0
|
8天前
R语言LME4混合效应模型研究教师的受欢迎程度
R语言LME4混合效应模型研究教师的受欢迎程度
|
8天前
|
机器学习/深度学习 算法 关系型数据库
PyTorch深度强化学习中蒙特卡洛策略梯度法在短走廊环境(CartPole-v0)中的实战(超详细 附源码)
PyTorch深度强化学习中蒙特卡洛策略梯度法在短走廊环境(CartPole-v0)中的实战(超详细 附源码)
31 0
|
8天前
|
机器学习/深度学习 算法 PyTorch
【PyTorch深度强化学习】带基线的蒙特卡洛策略梯度法(REINFOECE)在短走廊和CartPole环境下的实战(超详细 附源码)
【PyTorch深度强化学习】带基线的蒙特卡洛策略梯度法(REINFOECE)在短走廊和CartPole环境下的实战(超详细 附源码)
55 0
|
机器学习/深度学习 自然语言处理 算法
少样本学习综述:技术、算法和模型
少样本学习(FSL)是机器学习的一个子领域,它解决了只用少量标记示例学习新任务的问题
622 0
|
机器学习/深度学习
【从零开始学习深度学习】5.用于分类问题的softmax回归模型原理简介
【从零开始学习深度学习】5.用于分类问题的softmax回归模型原理简介
【从零开始学习深度学习】5.用于分类问题的softmax回归模型原理简介
|
机器学习/深度学习 算法
机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(下)(学习笔记+公式推导)
本博客为博主在学习 机器学习【西瓜书 / 南瓜书】过程中的学习笔记,每一章都是对《西瓜书》、《南瓜书》内容的总结和提炼笔记,博客可以作为各位读者的辅助思考,也可以做为读者快读书籍的博文,本博客对西瓜书所涉及公式进行详细的推理以及讲解,本人认为,不推导公式所学得的知识是没有深度的,是很容易忘记的,有些公式推导起来并不复杂,只是被看似复杂的数学表达式所“吓唬”,希望大家拿上纸笔,跟着博主一起学习,一起推导。
165 0
机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(下)(学习笔记+公式推导)
|
机器学习/深度学习 算法
机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(上)(学习笔记+公式推导)
本博客为博主在学习 机器学习【西瓜书 / 南瓜书】过程中的学习笔记,每一章都是对《西瓜书》、《南瓜书》内容的总结和提炼笔记,博客可以作为各位读者的辅助思考,也可以做为读者快读书籍的博文,本博客对西瓜书所涉及公式进行详细的推理以及讲解,本人认为,不推导公式所学得的知识是没有深度的,是很容易忘记的,有些公式推导起来并不复杂,只是被看似复杂的数学表达式所“吓唬”,希望大家拿上纸笔,跟着博主一起学习,一起推导。
241 0
机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(上)(学习笔记+公式推导)

热门文章

最新文章