中国人工智能学会通讯——深度学习与推荐系统 2.2 深度交互函数学习 (Learning Interaction Function with Deep Learning)

简介:

2.2 深度交互函数学习 (Learning Interaction Function with Deep Learning)

作为早期使用神经网络进行评分建模的代表性工作,文献[42]使用限制玻尔兹曼机(RBM)学习交互函数,但该方法的近似优化算法较为费时[28],且不易扩展到有辅助信息的情况。近期,我们在WWW2017上[6]提出了一个简单通用的基于神经网络的协同过滤框架(Neural Collaborative Filtering,NCF)。其基本思想是将用户和物品表示为隐空间的低维向量后,使用多层神经网络从数据中学习交互函数。图5展示了NCF的基本框架。

image

输入层是对用户和物品原始数据进行one-hot编码后的特征向量;在没有辅助信息时,原始数据可以仅为用户ID和物品ID。随后是表示层,以获得用户和物品的隐向量表示。然后用户通道和物品通道的隐向量一起输入到一个多层神经网络,用于学习用户和物品之间的交互函数;该交互网络的最后一层通过全连接层输出模型预测分数。NCF是个通用的框架——通过设计输入数据和每一层的操作,NCF可以表示出许多现有的推荐模型。图1展示了如何将矩阵分解模型表示为NCF的一个特例;在此基础上,如果将用户通道的输入数据表示为用户评分历史(去除当前交互物品i),该模型为FISM模型[21];如果将用户通道的输入表示为用户ID和评分历史的拼接向量,该模型则为SVD++模型[1];如果将用户通道和物品通道的输入设计为ID和属性,该模型则为SVDFeature模型[29]。

除表示现有推荐模型之外,多个新的基于NCF的深度学习模型被提出。例如,文献[6]提出NeuralMF,在隐含层组合矩阵分解模型和多层感知机模型,其中多层感知机使用与矩阵分解不同的表示层,用于建模用户和物品之间的非线性交互关系。该模型有较强的表示能力和泛化能力,在Top-K物品推荐中有较好的效果。近期,文献[23]提出了属性敏感的(attribute-aware)NCF变种,重点考虑不同属性之间的交互。图6展示了该模型。其中,主要不同于NCF的地方在于Pooling层的操作:

image

NCF默认采取average pooling,假设所有属性的表示是独立的;而该模型使用一种新的bilinear pooling方式,受启发于分解机模型[25],可以考虑ID与属性,以及所有属性对之间的交互。该模型在跨域的物品推荐(cross-domain recommendation)中展示了较好的效果。

近期,来自于谷歌和微软的研究人员也分别发布了基于特征的深度学习推荐系统[12, 20,44]。其中Wide&Deep[12]的Wide部分采用线性回归模型,Deep部分采用基于特征表示学习的多层感知机模型。Deep Crossing[20]用于在线广告的点击率预测,但该模型架构同样可以用于推荐系统中(需加入用户ID和物品ID作为输入以学习协同过滤效果)。图7描述了Deep Crossing的模型架构,其中与Wide&Deep的主要区别在于使用了残差网络的部件(residual component)[45],可以防止加深网络时梯度消失的问题。

image

值得一提的是,Wide&Deep和Deep Crossing在模型底层融合多个特征的表示向量时,均采用了向量拼接(concatenation)的操作。由于该操作不考虑向量之间的交互,使得模型完全依赖于之后的多层感知机学习特征之间的交互。虽然深度网络被证明有极强的函数学习能力,但其同样也难以训练,例如过拟合、退化和对初始化高度敏感等问题[45]。而且在我们最近实测中[27],基于深度学习的Wide&Deep和Deep Crossing的预测结果反而弱于浅层的分解机模型。为了解决这个问题,我们在最近的SIGIR 2017的工作中[27]提出了一个新的深度学习模型,在Wide&Deep基础上将底层的向量拼接操作替换为新提出的Bilinear Interaction Pooling操作

image

该操作考虑了所有特征表示向量之间的pair-wise交互关系。如果将pooling层直接输出到预测值,该模型则和分解机模型相同,因此称之为深度分解机模型(Neural Factorization Machine,NFM)。在上下文敏感的推荐任务中(context-aware recommendation),仅加深一层的NFM显著提高分解机7%,其准确度不仅超过了3层的Wide&Deep和10层的Deep Crossing模型,而且NFM架构相对简单,训练起来更容易更高效。在随后的工作中[41],我们进一步扩展了NFM模型,将注意力机制引入pooling操作中,用于学习每个特征交互的权重,改进了模型的表示能力和可解释性。

目录
打赏
0
0
0
0
16429
分享
相关文章
人工智能在虚拟客服中的关键作用:提升交互体验与服务效率
人工智能在虚拟客服中的关键作用:提升交互体验与服务效率
321 90
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
358 9
深度学习之自主学习和任务规划
基于深度学习的自主学习和任务规划,是指通过深度学习算法使人工智能(AI)系统能够自主地从环境中学习,并根据特定的目标和任务,规划出有效的解决方案。
217 3
打造智能音乐推荐系统:基于深度学习的个性化音乐推荐实现
本文介绍了如何基于深度学习构建个性化的音乐推荐系统。首先,通过收集和预处理用户行为及音乐特征数据,确保数据质量。接着,设计了神经协同过滤模型(NCF),利用多层神经网络捕捉用户与音乐间的非线性关系。在模型训练阶段,采用二元交叉熵损失函数和Adam优化器,并通过批量加载、正负样本生成等技巧提升训练效率。最后,实现了个性化推荐策略,包括基于隐式偏好、混合推荐和探索机制,并通过AUC、Precision@K等指标验证了模型性能的显著提升。系统部署方面,使用缓存、API服务和实时反馈优化在线推荐效果。
243 15
使用Python实现智能食品推荐系统的深度学习模型
使用Python实现智能食品推荐系统的深度学习模型
256 2
深度学习之少样本学习
少样本学习(Few-Shot Learning, FSL)是深度学习中的一个重要研究领域,其目标是在只有少量标注样本的情况下,训练出能够很好地泛化到新类别或新任务的模型。
114 2
深度学习中的迁移学习技术
【10月更文挑战第11天】 本文探讨了深度学习中的迁移学习技术,并深入分析了其原理、应用场景及实现方法。通过实例解析,展示了迁移学习如何有效提升模型性能和开发效率。同时,文章也讨论了迁移学习面临的挑战及其未来发展方向。
深度学习之复杂推理与逻辑学习
基于深度学习的复杂推理与逻辑学习是当前人工智能领域中的一个前沿研究方向,旨在结合深度学习与传统逻辑推理的优势,使机器能够在处理复杂任务时具备更强的推理能力。
91 2
使用Python实现智能电子商务推荐系统:深度学习模型详解
使用Python实现智能电子商务推荐系统:深度学习模型详解
435 4
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】在人工智能的推动下,个性化学习系统逐渐成为教育领域的重要趋势。深度学习作为AI的核心技术,在构建个性化学习系统中发挥关键作用。本文探讨了深度学习在个性化推荐系统、智能辅导系统和学习行为分析中的应用,并提供了代码示例,展示了如何使用Keras构建模型预测学生对课程的兴趣。尽管面临数据隐私和模型可解释性等挑战,深度学习仍有望为教育带来更个性化和高效的学习体验。
324 0

热门文章

最新文章