推荐系统去流行度偏差(bias)文献四篇

简介: 推荐系统去流行度偏差(bias)文献四篇

Keeping Dataset Biases out of the Simulation : A Debiased Simulator for Reinforcement Learning based Recommender Systems. (RecSys 2020)


作者为了解决历史数据中的用户与项目之间存在的两种交互偏差:选择偏差和流行度偏差,提出在构造“用户-项目”评级矩阵之前执行去偏差的步骤。由于选择偏差和流行度偏差,导致历史记录中用户对项目的评级是有选择性的,所以依照历史数据构造的评级矩阵的稀疏性不是随机存在的,作者在模拟选择偏差时,对用户更可能喜欢的项目进行声明,使它有更高概率被用户评级,在模拟流行度偏差时,对流行度高的项目进行声明,使它有更高概率被用户评级。然后根据模拟数据拟合出用户选择某一物品的概率,再利用IPS方法对项目评级进行重要性加权以实现去偏。


Popularity-Opportunity Bias in Collaborative Filtering (WSDM 2021)


作者从两个角度看待流行度偏差产生的影响:对用户的影响以及对推荐项的影响。其中对用户的影响是推荐系统会优先推荐高流行度的项目,同样可能被用户所喜欢的低流行度项目被推荐的机会更少;对推荐项的影响是低流行度的推荐项会越来越不受重视,最终偏差累计会使得推荐系统被流行的项目主导。作者提出了后处理方法和内处理方法来缓解流行度偏差。后处理方法是对低流行度的项目施加补偿,给它更高的得分从而获得与高流行度项目相似的排名。内处理方法是将流行度与项目推荐解耦,利用皮尔逊相关系数的平方作为正则化项,然后通过最小化正则化项和推荐误差来降低偏差。


Analyzing Item Popularity Bias of Music Recommender Systems: Are Different Genders Equally Affected? (RecSys 2021)


作者为了量化研究流行度偏差的特征,提出了七种指标来度量流行度偏差:平均值、中位数、方差、偏斜度、峰态系数、KL散度、肯德尔系数。其中。平均值、中位数用于表现推荐项流行度与实际流行度的总体趋势;方差用于表示历史记录与推荐列表之间多样性的变化;偏斜度、峰态系数用于表示推荐项目与实际选择项目两种分布之间的形状差异;KL散度、肯德尔系数在量化了推荐项目与实际选择项目两种分布之间的相似程度。同时作者研究了音乐推荐系统中流行度偏差与用户特征之间的关系,结论是不同性别的用户受到流行度偏差的影响是不同的,女性用户更容易受到流行度偏差的影响。


Diverse User Preference Elicitation with Multi-Armed Bandits. (WSDM 2021)


作者流行度偏差会影响到推荐的多样性,因此提出了一种基于Multi-armed Bandit的方法同时提高项目多样性和主题多样性。该方法对每个用户独立运行一个Bandit,然后对可能存在的主题各用一个Arm控制,每次迭代时选择值最高的一个Arm所控制的主题,将该主题内包含的所有项根据与当前用户偏好的多样性进行降序排序,再从排序后的项目列表中选择推荐项,作者称为引出项。由于引出项本身可能同时属于多个主题,所以该方法同时保证了主题多样性和项目多样性。


相关文章
|
机器学习/深度学习 算法 搜索推荐
CIKM论文解读 | 淘宝内容化推荐场景下对多场景全域表征的思考与应用
我们结合逛逛推荐场景中的具体问题,从多场景全域表征的视角进行了一系列的探索与内容推荐场景的应用,从全域表征的范围、信息迁移方式以及模型框架的应用等维度展开我们的优化工作,取得了阶段性的优化经验和业务效果。
1551 0
鲁棒优化入门(三)——鲁棒优化工具箱RSOME快速上手与应用实例
本文主要参考RSOME工具箱的用户手册《Users Guide for RSOME》 RSOME的用户手册并不是很长,但一些地方可能不是特别好理解,在这里我主要是通过写博客分享一下我的使用方法,和大家一起学习,也能加深自己的理解。
|
算法 搜索推荐 数据格式
基于用户的协同过滤算法(及3种计算用户相似度的方法)
本文参考《推荐系统实践》中基于用户的协同过滤算法内容。基于老师上课讲解,自己实现了其中的代码,了解了整个过程。
840 0
|
机器学习/深度学习 人工智能 自然语言处理
大厂技术实现 | 多目标优化及应用(含代码实现)@推荐与计算广告系列
推荐,搜索,计算广告是互联网公司最普及最容易商业变现的方向,也是算法发挥作用最大的一些方向,前沿算法的突破和应用可以极大程度驱动业务增长,这个系列咱们就聊聊这些业务方向的技术和企业实践。本期主题为多目标学习优化落地(附『实现代码』和『微信数据集』)
8305 6
大厂技术实现 | 多目标优化及应用(含代码实现)@推荐与计算广告系列
|
机器学习/深度学习 存储 分布式计算
KDD 2022 | 快手提出基于因果消偏的观看时长预估模型D2Q,解决短视频推荐视频时长bias难题
KDD 2022 | 快手提出基于因果消偏的观看时长预估模型D2Q,解决短视频推荐视频时长bias难题
1366 0
|
机器学习/深度学习 监控 搜索推荐
推荐系统中的偏差:主要挑战和近期突破
虽然这些系统在帮助用户发现新内容或产品方面非常有用,但它们也存在着各种偏差,可能导致效果非常差的推荐结果。今天围绕推荐系统的主要研究之一就是如何去除偏差。 在本文中,我们将深入探讨5种最普遍的推荐系统偏差,并了解一些来自谷歌、YouTube、Netflix、快手等公司的最新研究成果。
858 0
|
Linux 异构计算 Windows
如何设置一个清爽的仿真窗口(仿真工具使用技巧)【Modesim/Questasim】
如何设置一个清爽的仿真窗口(仿真工具使用技巧)【Modesim/Questasim】
如何设置一个清爽的仿真窗口(仿真工具使用技巧)【Modesim/Questasim】
|
搜索推荐 算法 大数据
基于用户(UserCF)和基于物品(ItemCF)协同过滤算法原理
大数据的典型应用之一就是推荐系统,淘宝、亚马逊、facebook等等大企业都在使用推荐系统,且推荐系统是它们盈利的相当大的来源。而基于用户的协同过滤算法和基于物品的协同过滤算法是推荐系统中最基本的算法,本文将用非常浅显易懂的语言对这两种算法进行原理剖析。
|
存储 关系型数据库 MySQL
MySQL性能优化指南
【10月更文挑战第16天】MySQL性能优化指南
1178 0