一种挖掘用户评论文本的跨领域冷启动用户推荐网络 | sigir论文解读

简介: 在大型推荐场景中,存在着众多类目(例如亚马逊平台中的书籍、影视推荐等)。用户往往只与其中部分类目有过交互,对于其他类目,由于缺少相应的历史行为记录,协同过滤方法会遭遇冷启动问题。

新零售智能引擎事业群出品

CATN: Cross-Domain Recommendation for Cold-Start Users via Aspect Transfer Network
文章链接:https://arxiv.org/abs/2005.10549
代码链接:https://github.com/AkiraZC/CATN

一、背景

在大型推荐场景中,存在着众多类目(例如亚马逊平台中的书籍、影视推荐等)。用户往往只与其中部分类目有过交互,对于其他类目,由于缺少相应的历史行为记录,协同过滤方法会遭遇冷启动问题。
为了缓解冷启动问题,一类可行的方法为利用用户在其他类目上的历史交互记录进行知识迁移(跨领域推荐),比如,给喜欢武侠小说的用户推荐古装电影。同时,为了更细致地刻画用户形象,参考用户的历史评论进行辅助推荐也能起到促进作用。
近年来,跨领域推荐和基于评论的个性化推荐均取得了不俗的进展,却鲜有工作将二者结合。这类工作主要存在以下挑战:1)用户在不同类目下的关注点是不同的,且只有少量稀疏特性存在关联,导致模型较难发现此类隐式关联;2)对于在当前类目下无历史记录的冷启动用户,若直接利用其他类目下该用户的评论文本,则会不可避免地带来用户特征的抽取误差,例如,喜欢粗糙质地工艺品的用户,不一定会喜欢粗糙材质的衣物。鉴别不同类目间评论文本的语义差异,也是一个不小的挑战。
针对以上问题,本文提出了一种挖掘用户在不同类目下的评论关联,进而对冷启动用户进行推荐的深度模型,称作CATN。CATN将用户在其他类目的历史评论融合为用户文档,将商品在当前类目的历史评论融合为商品文档,通过抽取文档中的多源aspect来表示用户/商品的细粒度特征关系,并引入“同好用户”进一步增强用户表示。实验表明CATN能够有效挖掘类目间的深层关联,进而提升冷启动用户的推荐系统评分预测任务。

二、问题定义和抽象

电商平台中有多个类目,设定当前类目为Target Domain,其他类目为Source Domain,我们的目标用户为在Source Domain上有过历史交互记录,而在Target Domain上无历史记录的冷启动用户,推荐系统任务为评分预测任务。
现有的针对冷启动用户的跨领域推荐算法往往包含三个步骤,如Figure 1:① Target Domain下用户/商品的表示学习;② Source Domain下用户/商品的表示学习;③ 两个类目下重叠用户的映射学习。对于Target Domain中的冷启动用户,依据步骤③训练的模型进行表示映射,进而展开推荐。
然而此类方法存在着以下缺陷:
1)将用户/商品特征映射为单个向量,忽略了细粒度建模;
2)步骤③的学习完全依赖于步骤①②的训练结果,容易导致误差积累;
3)不同类目间的关联学习仅能通过重叠用户的表示显式学出,当两个类目间重叠用户的数量较少时,易导致训练不足。
同时,现有方法仅仅基于用户的历史点击行为进行表示学习,未能将评论文本纳入其中,因而在用户/商品特征建模方面有所欠缺。
image.png

三、技术选择

本文构建了一个端到端的深度神经网络模型,主要解决Target Domain中冷启动用户的推荐问题。模型的基本思想是利用用户在Source Domain中的评价文本数据进行知识迁移,整体训练流程如Figure 2。其中左侧蓝色矩形和右侧绿色矩形分别代表两类训练流程:将用户在Source Domain的历史评论文本应用到Target Domain进行推荐,反之亦然。这两个流程在网络结构上完全相同,我们定义了全局共享参数和流程特有参数,使两个流程在训练过程中以小批量轮流训练,进而能够充分学习两个类目间的信息交互。
image.png

以左侧流程为例,我们的模型结构如Figure 3,主要分为以下三个部分:
image.png
1)用户兴趣(商品特性)的细粒度抽取。我们将用户的历史评论文本汇总构成“用户文档”,“商品文档”同之。以“用户文档”为例,首先将其映射image.png
到词向量空间E_u=(e_1,e_2,…,e_l ),接着进行一维文本卷积操作得到C_u=(c_(1,u),c_(2,u),…,c_(l,u) ),使用门控机制进行多细粒度的aspect特征抽取g_(m,j,u)=(W_m c_(j,u)+b_m )⊙σ(W_m^g c_(j,u)+b_m^g ),m=1,2,…,M,其中M为预定义的aspect个数。“商品文档”的操作与上述相同,且同一个流程中参数共享。为了克服不同类目间评论文本的语义差异,我们基于不同类目aspect query的注意力机制进行抽取,得到用户的aspect表示A_u=[a_(1,u),...,a_(M,u)]。
其中v_(m,s)为Source Domain的aspect query,同样地,Target Domain的aspect query v_(m,t)将作用于当前类目下评价文本的特征抽取。
2)“同好用户”评论辅助增强。鉴于两个类目间的重叠用户数量可能较少,我们尝试利用与目标用户有着相同兴趣的用户(同好用户)评论进行辅助增强。“同好用户”的定义可以根据其个人信息、历史行为或社交关系作为依据,本文中我们参考了PARL [Wu et al. CIKM“2018]中的定义,将对同一件商品打分相同的用户作为“同好用户”,并将目标用户的所有“同好用户”所写的评论融合得到其的辅助评论。鉴于辅助评论由不同用户所撰写,文字风格存在较大差异,我们设计了额外的文本卷积层,如Figure 3所示。经过与1)中相似的特征抽取过程,得到辅助评论的aspect表示A_(u_aux ),最后利用基于门控机制的表示融合,得到最终的用户特征表示A_u。
image.png

3)跨领域关联学习。用户在不同类目间的兴趣关联往往是稀疏而有针对性的,因此我们设计了对应的稀疏矩阵结构进行刻画。具体来讲,全局aspect相关矩阵S由Source Domain和Target Domain下的aspect query表示相乘得到(leakyRelu激活函数体现稀疏性),具体的aspect匹配矩阵S_(u,i)由从文本特征挖掘而来的aspect表示相乘得到,公式如下,其中b_u和b_i为用户和商品的偏置项,r ̂_(u,i)为推荐预测分数。
image.png

四、技术创新

相较于现有方法,CATN主要在以下几个方面具有创新性:
1)通过对用户评论的细粒度特征建模,有效刻画了用户/商品的细粒度特征/兴趣,以及跨类目间用户的兴趣关联;
2)摒弃了先前工作的3-step训练流程,通过端到端的训练方式,有效避免了各阶段的误差累积;
3)通过引入“同好“用户增强用户表示,一方面增加了训练数据的多样性,另一方面从相似用户的层面增强了对冷启动用户的推荐效果。

五、实验

本文实验在Amazon数据集中最大的三个类目(Book, Movie, Music)展开,两两配对形成三个场景,并在训练集中按照不同比例采样重叠用户。实验结果如Table 3,前5个baseline基于三步训练策略,ANR [Chin et al. CIKM’18]为基于评论的aspect推荐方法,这里直接将用户在Source Domain 的评论与Target Domain的商品评论进行交互。由Table 3可知,CATN达到了最优的效果。
image.png

我们对模型的可解释性进行分析,Figure 5为全局aspect相关矩阵S可视化图,类目间的相关特征往往集中于某一个/几个区域。Table 6展示了场景1(Book-Movie)中评论文档attention权重排名top5的词汇,通过人工归纳标签,发现Book类目第二/三个aspect为故事情节性的特征,Movie类目第三个aspect为电影内容,二者具有强烈的相关性,体现在全局aspect相关矩阵S中右下角的几个方块颜色最深,说明CATN具有一定的推荐可解释性。
image.png

更多信息检索技术内容请查看:独家下载!《SIGIR 顶会论文解读》电子书重磅发布

相关文章
|
1月前
|
机器学习/深度学习 自然语言处理 算法
【从零开始学习深度学习】49.Pytorch_NLP项目实战:文本情感分类---使用循环神经网络RNN
【从零开始学习深度学习】49.Pytorch_NLP项目实战:文本情感分类---使用循环神经网络RNN
|
2月前
|
机器学习/深度学习 计算机视觉 知识图谱
【YOLOv8改进】MobileViT 更换主干网络: 轻量级、通用且适合移动设备的视觉变压器 (论文笔记+引入代码)
MobileViT是针对移动设备的轻量级视觉Transformer网络,结合CNN的局部特征、Transformer的全局注意力和ViT的表示学习。在ImageNet-1k上,它以600万参数实现78.4%的top-1准确率,超越MobileNetv3和DeiT。MobileViT不仅适用于图像分类,还在目标检测等任务中表现出色,且优化简单,代码已开源。YOLOv8引入了MobileViT块,整合卷积和Transformer结构,提升模型性能。更多详情可参考相关专栏和链接。
|
2月前
|
机器学习/深度学习 自然语言处理 搜索推荐
【传知代码】图神经网络长对话理解-论文复现
在ACL2023会议上发表的论文《使用带有辅助跨模态交互的关系时态图神经网络进行对话理解》提出了一种新方法,名为correct,用于多模态情感识别。correct框架通过全局和局部上下文信息捕捉对话情感,同时有效处理跨模态交互和时间依赖。模型利用图神经网络结构,通过构建图来表示对话中的交互和时间关系,提高了情感预测的准确性。在IEMOCAP和CMU-MOSEI数据集上的实验结果证明了correct的有效性。源码和更多细节可在文章链接提供的附件中获取。
【传知代码】图神经网络长对话理解-论文复现
|
18天前
|
Web App开发 自然语言处理 算法
一文搞懂:【论文笔记】BINE:二分网络嵌入
一文搞懂:【论文笔记】BINE:二分网络嵌入
13 0
|
2月前
|
计算机视觉
【YOLOv8改进】 AFPN :渐进特征金字塔网络 (论文笔记+引入代码).md
YOLO目标检测专栏介绍了YOLO的有效改进和实战案例,包括AFPN——一种解决特征金字塔网络信息丢失问题的新方法。AFPN通过非相邻层直接融合和自适应空间融合处理多尺度特征,提高检测性能。此外,还展示了YOLOv8中引入的MPDIoU和ASFF模块的代码实现。详情可参考提供的专栏链接。
|
2月前
|
机器学习/深度学习 存储 测试技术
【YOLOv8改进】 YOLOv8 更换骨干网络之 GhostNet :通过低成本操作获得更多特征 (论文笔记+引入代码).md
YOLO目标检测专栏探讨了卷积神经网络的创新改进,如Ghost模块,它通过低成本运算生成更多特征图,降低资源消耗,适用于嵌入式设备。GhostNet利用Ghost模块实现轻量级架构,性能超越MobileNetV3。此外,文章还介绍了SegNeXt,一个高效卷积注意力网络,提升语义分割性能,参数少但效果优于EfficientNet-L2。专栏提供YOLO相关基础解析、改进方法和实战案例。
|
2月前
|
机器学习/深度学习 监控 自动驾驶
【传知代码】从零开始搭建图像去雾神经网络-论文复现
本文介绍了基于集成学习的双分支非均匀去雾神经网络的复现,该网络由迁移学习子网和数据拟合子网组成,分别处理全局表示和数据拟合。网络使用Res2Net作为编码器,并结合通道和像素注意力模块。代码可在提供的链接下载。网络在交通监控、自动驾驶、航海和目标跟踪等领域有广泛应用,通过提升图像质量来提高系统性能。实验在O-Haze、I-Haze和NH-Haze数据集上进行,展示了网络在去除雾霾方面的效果,尽管存在细节模糊和色彩饱和度低的问题。
|
1月前
|
机器学习/深度学习 算法 PyTorch
【从零开始学习深度学习】50.Pytorch_NLP项目实战:卷积神经网络textCNN在文本情感分类的运用
【从零开始学习深度学习】50.Pytorch_NLP项目实战:卷积神经网络textCNN在文本情感分类的运用
|
2月前
|
机器学习/深度学习 数据可视化 计算机视觉
【YOLOv8改进】MCA:用于图像识别的深度卷积神经网络中的多维协作注意力 (论文笔记+引入代码)
YOLO目标检测专栏介绍了YOLO的创新改进和实战案例,包括多维协作注意力(MCA)机制,它通过三分支架构同时处理通道、高度和宽度注意力,提高CNN性能。MCA设计了自适应组合和门控机制,增强特征表示,且保持轻量化。该模块适用于各种CNN,实验证明其在图像识别任务上的优越性。此外,文章还展示了如何在YOLOv8中引入MCA层的代码实现和相关任务配置。
|
2月前
|
机器学习/深度学习 计算机视觉
【YOLOv8改进】 YOLOv8 更换骨干网络之GhostNetV2 长距离注意力机制增强廉价操作,构建更强端侧轻量型骨干 (论文笔记+引入代码)
该专栏聚焦YOLO目标检测的创新改进与实战,介绍了轻量级CNNs和注意力机制在移动设备上的应用。文章提出了一种名为GhostNetV2的新架构,结合了硬件友好的DFC注意力机制,强化了特征表达能力和全局信息捕获,同时保持低计算成本和高效推理。GhostNetV2在ImageNet上以167M FLOPs达到75.3%的top-1准确率,优于同类模型。创新点包括DFC注意力、模型结构优化和效率提升。源代码可在GitHub和MindSpore平台上找到。此外,还提到了YOLOv8的相关实现和任务配置。