了解电子商务系统中的回音室效应 | SIGIR论文解读

简介: 个性化推荐系统在为用户带来更精准商品的同时,也对消费者的兴趣偏好和行为造成影响,例如回音室效应。回音室是指用户不断接受相似的信息和内容, 从而使得他们的兴趣或者态度被不断强化。这种现实通常出现在社交媒体和网络平台,也同样可能出现在电子商务等推荐系统中。

新零售智能引擎事业群出品

代码:https://github.com/szhaofelicia/EchoChamberInEcommerce

一. 前言

个性化推荐系统在为用户带来更精准商品的同时,也对消费者的兴趣偏好和行为造成影响,例如回音室效应。回音室是指用户不断接受相似的信息和内容, 从而使得他们的兴趣或者态度被不断强化。这种现实通常出现在社交媒体和网络平台,也同样可能出现在电子商务等推荐系统中。我们的研究集中在电子商务的推荐系统对用户兴趣的影响,利用淘宝的大规模用户数据检验是否存在回音室效应。
根据回音室效应的定义,我们分两步检验其影响。首先,我们将测量用户的兴趣是否被强化。如果用户兴趣确实被加强, 接下来我们观察强化效应是否是接收的内容造成的,即系统推荐的商品被限制在逐渐缩小的范围内。也就是说,我们同时需要检验是推荐系统中是否存在过滤气泡的现象。我们在实验中采用分组对比的方法,利用聚类算法和有效性指标从群体水平分析用户受到的影响。实验结果证明电子商务系统,即淘宝平台,用户的点击行为中的确出现了回音室效应。然而, 这个现象在用户的购买行为中被削弱了。

二. 回音室和过滤气泡效应的背景

回音室(echo chamber)和过滤气泡(filter bubble)效应都是个性化推荐系统造成的负面影响,这两个概念并不独立。回音室效应[2]描述了由于不断接触相似的信息,用户喜好被持续强化的现象,而过滤气泡效应则解释了推荐系统会把用户隔离在一致,单一的信息环境中[5]。由此可见,过滤气泡效应是造成回音室效应的一种因素。
在社交媒体中,回音室和过滤气泡效应都会导致社会群体的分裂和观点的极化[1]。很多研究集中在脸书,推特等平台出现的回音室效应,这些研究认为个性化的内容推荐造成了线上社群的极化和虚假内容的传播 [3]。另一部分研究集中在推荐系统中的回音室效应,他们利用模拟的数据预测推荐系统如何影响用户兴趣[2]。回音室加剧了平台内容的极化,而过滤气泡效应则进一步降低了的多样性。
然而,目前的研究仍存在一定局限性。其中一个明显的问题是很多结论不是基于实时数据而是仿真或是自定义的模型下的结果。另外一个问题是很多研究混淆了回音室和过滤气泡的定义。很多研究将它们混为一谈,或是只研究其中之一回避了两者的相关性。我们的研究解决了上述问题:一方面,在检验回音室效应的同时也检测可能造成其的因素,即过滤气泡效应;另一方面,来自淘宝的实时数据使我们不必使用仿真去验证推荐系统对用户的影响。

三. 研究问题和解决方案

我们的目的在于研究电子商务推荐系统对用户影响。不同于社交媒体和其他类似的平台,用户的兴趣偏好在电子商务系统更加多样和复杂。例如在社交网络中,我们可以将用户的观点归类为正反两个的方向,即支持和反对,观察任一方向的强化即可验证系统对用户偏好的影响。但是在电子商务中,用户的喜好围绕各类商品,多种类型的产品导致我们无法用“正反”来定义用户的兴趣。电子商务中的用户行为也为我们的研究增加了难度,我们很难观察到评论,添加删除好友等社交网络中具体明确的行为。用户和平台的交互以间接的方式构成推荐系统和用户的相互影响,因而我们的测量只能利用购买,浏览,点击等用户的历史记录。基于以上两个特征,我们选择测量群体水平的变化,利用聚类的方式分析用户兴趣特征,并观察群体水平推荐内容的多样性变化趋势。我们的方法可以总结为以下两个问题:
(1) 我们测量一段时间内用户喜好的变化,判断用户兴趣是否被强化。
(2) 如果用户兴趣的确得到加强,我们接下来检测这是否是因为用户接触的内容被限制,多样性降低。
我们采用已有研究中的方法[4],利用分组的方式,根据用户采纳推荐商品的频率将用户分为采纳推荐组(Following Group)和不采纳推荐组(Ignoring Group)。对比两组的结果,我们可以观察到推荐系统对用户的影响。以上方法有效地检测电子商务场景的回音室效应,论文的贡献具体为以下几点:提出群体水平 的聚类分析方式;根据用户行为分组,从而测量回音室的影响;我们的实验使用实时用户数据,并分别研究了用户点击,购买行为的变化。

四. 数据集

我们采用淘宝用户的数据集,涵盖86192用户从2019年1月1日到5月31日共五个月的三种记录:浏览,点击和购买(表1)。我们只使用后三个月的数据以确保用户已经熟悉淘宝平台的各项功能。随后根据用的clicked PV (clicked page review), 抽取出Following Group和Ignoring Group两组用户。我们将至少包含一个点击商品的推荐列表定义为clicked PV,并计算全部PV中clicked PV的比例—PVR (page review ratio)。如图1所示,PVR在20%以下的用户归入Ignoring Group,PVR在80%以上的用户以下的用户归入Following Group。分组之后,我们共得到六组数据(表2)。
为了提取用户兴趣嵌入向量(user embedding)和产品嵌入向量(item embedding),我们将用户记录划分为小区间(block)。每个区间包含相同数量的记录,例如用户的点击,浏览和购买。通过比较三个月中第一个(first block)和最后一个区间(last block)的用户兴趣变化,我们就可以检测推荐系统在这段时间造成的影响。采用目前最先进的方法之一[6],我们提取出产品嵌入向量(item embedding)用于测量内容多样性,并计算每个区间的平均产品嵌入作为用户兴趣嵌入(user embedding)用于检测用户兴趣强化。

image.png

表1 实验数据

image.png

图1. 用户分组

image.png

表2 用户分组数据

五. 测量方法和结果

(一) 测量用户兴趣强化程度
我们先用霍普金斯统计量(Hopkins statistic)确认每组数据都可以产生有效的距离结果,计算结果用H表示。这项指标代表了数据的聚集程度,当指标超过0.5时,数据集有聚类倾向,计算公式如下:

image.png

S¬¬i和t¬¬i分别表示采样数据在随机数据和待测数据集的最小近邻距离。如表3所示,所有用户组数据均有聚类倾向。

image.png

表3 霍普金斯统计量

由于我们采用k-平均演算法(k-means clustering), 我们需要为每组数据选择最优的聚类数量,即K*。考虑到高维嵌入向量的复杂性,我们使用贝叶斯信息量准则(Bayesian information criterion,BIC)选取合适的K。BIC越高,说明K越适合数据集。贝叶斯信息量准则通常用于模型的最大似然估计,我们采用适用于切割式分群聚类的计算公式:

image.png

K表示聚类数量,ni表示聚类的大小,Σ表示方差,N为数据集大小。
image.png

图2 BIC

.

各组数据的BIC曲线如图2,点击嵌入向量Following Group和Ignoring group的K分布是24和20,购买嵌入向量Following Group和Ignoring Group的K分布是11和9。由于峰值附近的的曲线较为平滑,我们把k的范围扩展到[K-5, K+5],各组的范围分别是[19,29],[15,25],[6,16]和[4,14]。
随后我们分别测量各项k值下的聚类有效性指标(clustering validity index),CH(Calinski-Harabasz index)和ARI (Adjusted rand index)。
测量CH指标时,我们只对第一个区间的嵌入向量进行聚类,直接将结果应用在最后一个区间对应的嵌入向量,之后测量两个区间的CH指标 (公式如下)。CH指标越高,聚类结果类间越分散,类内越聚集,聚类结果越好。在我们的实验中,CH指标下降较少的用户组则兴趣强化的程度较高。SSBK和SSWk分布表示类间和类内的平方距离,N表示数据集大小。
image.png

结果如图3和表4所示,无论是点击嵌入向量还是购买嵌入向量,Following Group的CH都下降较小,说明该组用户兴趣被强化。
image.png

图3 CH

image.png

表4 各组用户CH指标下降值

ARI的测量结果也印证了这一结论。不同于CH,ARI可以看做两个不同聚类结果的相似度,通常被用来比较待测结果和最优结果的差距。ARI数值越高,说明两个聚类结果越接近。我们利用ARI测量同组用户前后两个区间数据各自的聚类结果,估计嵌入向量的变化。ARI计算公式如下:

image.png

pi和qj分别表示不同聚类的数据,n¬ij表示两个聚类i,j共同包含的数据。
从图4和表5可得,Following Group的用户兴趣受到的影响更大。无论是点击还是购买嵌入向量,Following Group的ARI都较高,说明聚类结果变化小。但是,购买嵌入向量的两组ARI差距不大,并不显著。

image.png

表5 各组用户的ARI指标

image.png

图4 ARI

(二) 推荐内容多样性变化趋势
基于聚类分析的结果,我们可以确定Following Group的用户兴趣的确被强化了。接下来我们检测这一差异的原因,即推荐内容多样性的变化。
我们通过计算每个用户在同一区间内各产品嵌入向量的欧式距离(公式如下),利用同一区间的距离均值表示推荐内容的多样性。平均距离越大, 说明推荐的内容越丰富。

image.png

之后我们计算同一组用户区间的平均推荐内容多样性,结果如表6和图5 所示。尽管存在多样性下降的整体趋势,分组结果显示只有Following Group存在推荐内容多样性降低,Ignoring Group的下降并不显著。

image.png

表6 推荐内容多样性均值

image.png

图5 各组用户推荐内容多样性的分布

我们可以推断,Following Group用户兴趣加强是由推荐内容多样性降低造成的。

六. 结论

根据实验结果,我们可以确定用户兴趣受到推荐系统影响,倾向于采纳推荐产的用户其偏好会逐渐增强。回音室效应的出现正是由于用户接触的信息范围变窄,推荐内容的多样性逐渐下降。我们同时也观察到回音室效应在不同用户行为中的程度并不一致。就点击行为表现出的用户偏好而言,这种影响较为明显,但购买行为体现出的用户喜好则较为稳定,回音室现象一定程度被抑制。我们认为这是由于购买行为受到客观因素的限制,用户并不能完全依照兴趣喜好消费商品。
我们今后的研究将基于这个结果,设计并构造能够有效降低回音室和过滤气泡效应的推荐算法,为电子商务平台的用户带来更有效多样的推荐。

七. 参考文献

[1] Pranav Dandekar, Ashish Goel, and David T Lee. 2013. Biased assimilation, homophily, and the dynamics of polarization. Proceedings of the National Academy of Sciences 110, 15 (2013), 5791–5796.
[2] Ray Jiang, Silvia Chiappa, Tor Lattimore, András György, and Pushmeet Kohli. 2019. Degenerate feedback loops in recommender systems. In Proceedings of the 2019 AAAI/ACM Conference on AI, Ethics, and Society. 383–390.
[3] Sina Mohseni and Eric Ragan. 2018. Combating Fake News with Interpretable News Feed Algorithm. arXiv preprint arXiv:1811.12349 (2018).
[4] Tien T Nguyen, Pik-Mai Hui, F Maxwell Harper, Loren Terveen, and Joseph A Konstan. 2014. Exploring the filter bubble: the effect of using recommender systems on content diversity. In Proceedings of the 23rd WWW. ACM, 677–686.
[5] Eli Pariser. 2011. The filter bubble: What the Internet is hiding from you. Penguin UK.
[6] Jizhe Wang, Pipei Huang, Huan Zhao, Zhibo Zhang, Binqiang Zhao, and Dik Lun Lee. 2018. Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba. Proceedings of the 24th ACM SIGKDD (2018).

更多信息检索技术内容请查看:独家下载!《SIGIR 顶会论文解读》电子书重磅发布

相关文章
|
7月前
|
机器学习/深度学习 传感器 自然语言处理
马斯克搞脑机得“开瓢”?MIT 早在研究「挂耳式耳机」,戴上=“把整个互联网装进脑子”!
上个月底,马斯克在 X 上发文称,第一位人类患者已接受 Neuralink 的脑机接口芯片植入,并表示“患者恢复良好”,还揭示了 Neuralink 的第一个芯片产品名为“Telepathy(心灵感应)”。
|
算法 测试技术 量子技术
90后山东小伙一作登Nature封面!硅量子比特里程碑达成,保真度超99%
90后山东小伙一作登Nature封面!硅量子比特里程碑达成,保真度超99%
90后山东小伙一作登Nature封面!硅量子比特里程碑达成,保真度超99%
|
机器人
首创!哈工大直接用微波驱控多自由度机器人,登上国际顶刊
首创!哈工大直接用微波驱控多自由度机器人,登上国际顶刊
|
人工智能 达摩院 并行计算
Nature封面:可控核聚变里程碑式新进展,燃烧等离子体实现
Nature封面:可控核聚变里程碑式新进展,燃烧等离子体实现
261 0
Nature封面:可控核聚变里程碑式新进展,燃烧等离子体实现
|
安全 开发者
最酷的黑客马拉松地点?30000英尺的高空
说到黑客马拉松,你很容易想起这些:拿着不放的手机,随处开着放在桌上的笔记本,当然还有互联网连接。但是英国航空公司”不接地创新实验室“中的开发者可没有这些东西,他们在空中进行了11个小时的黑客马拉松。
193 0
最酷的黑客马拉松地点?30000英尺的高空
|
传感器 安全 算法
秒杀波士顿动力狗,MIT猎豹机器人闭着眼跳桌狂奔
机器人领域又一大突破:MIT最新研发的第三代猎豹机器人,不依靠视觉和任何外部传感器,全凭控制算法,漂亮地纵身飞跃上桌,还能轻松爬上满是障碍物的楼梯,在突然被猛推或猛拉时迅速恢复平衡。这样的机械狗,你要不要也来一只?
1764 0
|
传感器 编解码 机器人
Nature:比人眼更强大,港科大开发高密度人工视网膜,科幻人造眼成现实
未来 10 年我们可能会亲眼见着仿生眼在我们生活中的大规模应用。
|
vr&ar
世界杯爆冷真相:这项技术九改判罚!帮西班牙起死回生
VAR成世界杯主角,扭转西班牙命运,介入将近1/2的点球判罚,“上帝之手”之类的足球冤案或将不复存在。6月28日消息,今年世界杯可谓戏剧化十足,反转剧情不断上演。在险象环生的西班牙伊朗一战后,VAR迅速攻占西班牙各大媒体头条。
1844 0