备案控制台

开发者社区机器之心文章正文

PinnerSAGE、ENSFM、MHCN、FFM…你都掌握了吗？一文总结推荐系统必备经典模型（二）（3）

2023-05-24 275

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： PinnerSAGE、ENSFM、MHCN、FFM…你都掌握了吗？一文总结推荐系统必备经典模型（二）

3、 PNN

预测用户的反应，如点击和转换，是非常重要的，并且已经在许多网络应用中使用，包括推荐系统、网络搜索和在线广告。这些应用中的数据大多是分类的，并且包含多个fields；针对这些数据的一个典型的表示方法是通过单次编码将其转化为高维稀疏二进制特征表示。面对极端的稀疏性，传统模型可能会限制其从数据中挖掘浅层模式的能力，即低阶特征组合。另一方面，由于巨大的特征空间，像深度神经网络这样的深度模型不能直接应用于高维度的输入。本文提出了一个基于产品的神经网络（ Product-based Neural Networks，PNN），它有一个嵌入层来学习分类数据的分布式表示，一个产品层来捕捉领域间类别的互动模式，以及一个全连接层来探索高阶特征互动。

图8. PNN结构

PNN结构如图8所示。输入层（Input）：一个类别型特征就是一个Field。比如用户信息包括：性别、职业等，这里的性别是一个Field，职业是另一个Field。图18中的Input是one-hot之后的，而且只给出了类别型特征。所以每个Field i都是一个向量，向量的大小就是类别型特征one-hot之后的维度。所以不同Field的维度是不同的。

嵌入层（Embedding）：是Field-wisely Connected，就是每个Field只管自己的嵌入，Field之间网络的权重毫无关系，自己学习自己的。而且只有权重，没有bias。不同的Field之间没有关系。一个Field经过嵌入后，得到一个Feature，也就是对应的嵌入向量（Embedding Vector）。其维度一般是预先设定好的固定值，论文中采用的是10。也就是说，不同Feature的维度经过embedding后都是一样的。

Product层：product思想来源于，在CTR预估中，认为特征之间的关系更多是一种and“且”的关系，而非add"加”的关系。例如，性别为男且喜欢游戏的人群，比起性别男和喜欢游戏的人群，前者的组合比后者更能体现特征交叉的意义。Product层可以分成两个部分，一部分是线性部分l_z，一部分是非线性部分l_p。二者的形式如下：
通过引入一个 "1 "的常数信号，product层不仅可以生成二次信号p，还可以保持线性信号z，如图18所示。
其中，f_i∈RM是field i的嵌入向量。p_i,j = g(f_i, f_j )定义了成对的特征交互。PNN模型可以通过设计不同的操作而有不同的实现方式。本文提出了PNN的两个变体，即IPNN（Inner Product-based Neural Network）和OPNN（Outer Product-based Neural Network）。field i的嵌入向量f_i，是嵌入层的输出：
其中，x是包含多个field的输入特征向量，x[start_i: end_i]代表field i的独热编码向量。W_0代表嵌入层的参数，(W_0)ⁱ∈RM×(end_i-start_i+1)与field全连接。

最后，将监督训练应用于最小化对数损失，以捕捉两个概率分布之间的分歧：
IPNN
在IPNN中，首先将成对的特征交互定义为矢量内积：g(f_i, f_j ) =<f_i, f_j>。在恒定信号 "1 "的情况下，线性信息z被保留为：
至于二次信息p，g(f_i, f_j )的成对内积项形成一个方形矩阵p∈R^NxN。

受FM启发，作者提出了矩阵分解的想法，以降低复杂性。通过引入(W_p)ⁿ=θⁿ θ^nT的假设，其中，θⁿ∈R^N，简化l_1的表述为：
通过对第n个节点的一阶分解，得到l_p如下：
更一般地说，我们讨论(W_p)ⁿ的K阶分解。(W_p)ⁿ=θⁿθ^nT只是强假设下的一阶分解。一般的矩阵分解方法可以由下式推导出来：

OPNN
矢量内积将一对矢量作为输入，输出一个标量。与此不同的是，矢量外积需要一对矢量并生成一个矩阵。IPNN通过向量内积定义了特征交互，接下来我们讨论基于外积的神经网络（OPNN）。IPNN和OPNN之间的唯一区别是二次项p。在OPNN中，定义特征交互如下：

此时，OPNN复杂度比IPNN还高。作者引入sum pooling降低复杂度，重新定义p的表述如下：

当前 SOTA！平台收录 PNN 共 2 个模型实现资源。

项目	SOTA！平台项目详情页
PNN	前往 SOTA！模型平台获取实现资源：https://sota.jiqizhixin.com/project/pnn

前往 SOTA！模型资源站（sota.jiqizhixin.com）即可获取本文中包含的模型实现代码、预训练模型及API等资源。

网页端访问：在浏览器地址栏输入新版站点地址 sota.jiqizhixin.com ，即可前往「SOTA！模型」平台，查看关注的模型是否有新资源收录。

移动端访问：在微信移动端中搜索服务号名称「机器之心SOTA模型」或 ID 「sotaai」，关注 SOTA！模型服务号，即可通过服务号底部菜单栏使用平台功能，更有最新AI技术、开发资源及社区动态定期推送。

文章标签：

机器学习/深度学习

搜索推荐

人工智能

关系型数据库

Windows

移动开发

API

关键词：

推荐系统模型

-开发达人-

目录

相关文章

我是廖志伟

|

8月前

|

机器学习/深度学习搜索推荐算法

推荐系统离线评估方法和评估指标，以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。

推荐系统离线评估方法和评估指标，以及在推荐服务器内部实现A/B测试和解决A/B测试资源紧张的方法。还介绍了如何在TensorFlow中进行模型离线评估实践。

我是廖志伟

451 0 0

Echo_Wish

|

2月前

|

机器学习/深度学习数据采集搜索推荐

使用Python实现智能食品推荐系统的深度学习模型

使用Python实现智能食品推荐系统的深度学习模型

Echo_Wish

119 2 2

土木林森

|

3月前

|

机器学习/深度学习搜索推荐大数据

深度解析：如何通过精妙的特征工程与创新模型结构大幅提升推荐系统中的召回率，带你一步步攻克大数据检索难题

【10月更文挑战第2天】在处理大规模数据集的推荐系统项目时，提高检索模型的召回率成为关键挑战。本文分享了通过改进特征工程（如加入用户活跃时段和物品相似度）和优化模型结构（引入注意力机制）来提升召回率的具体策略与实现代码。严格的A/B测试验证了新模型的有效性，为改善用户体验奠定了基础。这次实践加深了对特征工程与模型优化的理解，并为未来的技术探索提供了方向。

土木林森

145 2 2

深度解析：如何通过精妙的特征工程与创新模型结构大幅提升推荐系统中的召回率，带你一步步攻克大数据检索难题

qa浪涛

|

3月前

|

机器学习/深度学习算法搜索推荐

django调用矩阵分解推荐算法模型做推荐系统

django调用矩阵分解推荐算法模型做推荐系统

qa浪涛

48 4 4

Echo_Wish

|

3月前

|

机器学习/深度学习搜索推荐 TensorFlow

使用Python实现智能电子商务推荐系统：深度学习模型详解

使用Python实现智能电子商务推荐系统：深度学习模型详解

Echo_Wish

259 4 4

楠竹11

|

4月前

|

搜索推荐算法

模型小，还高效！港大最新推荐系统EasyRec：零样本文本推荐能力超越OpenAI、Bert

【9月更文挑战第21天】香港大学研究者开发了一种名为EasyRec的新推荐系统，利用语言模型的强大文本理解和生成能力，解决了传统推荐算法在零样本学习场景中的局限。EasyRec通过文本-行为对齐框架，结合对比学习和协同语言模型调优，提升了推荐准确性。实验表明，EasyRec在多个真实世界数据集上的表现优于现有模型，但其性能依赖高质量文本数据且计算复杂度较高。论文详见：http://arxiv.org/abs/2408.08821

楠竹11

108 7 8

LKIDTI数据

|

3月前

|

机器学习/深度学习搜索推荐算法

推荐系统的矩阵分解和FM模型

推荐系统的矩阵分解和FM模型

LKIDTI数据

26 0 0

轻松学编程

|

7月前

|

机器学习/深度学习搜索推荐算法

基于深度学习神经网络协同过滤模型(NCF)的图书推荐系统

登录注册热门图书图书分类图书推荐借阅图书购物图书个人中心可视化大屏后台管理

轻松学编程

13148 2 5

基于深度学习神经网络协同过滤模型(NCF)的图书推荐系统

楠竹11

|

6月前

|

机器学习/深度学习数据采集搜索推荐

打开黑盒神经网络！港大推出全新会说话的推荐系统大模型XRec，从黑盒预测到可解释

【7月更文挑战第2天】港大研发XRec模型，将可解释性引入推荐系统。XRec结合大型语言模型的语义理解与协同过滤，生成推荐的文本解释，提升透明度。该模型无关设计允许与各类推荐系统配合，增强用户体验。然而，计算资源需求高、数据质量和用户理解能力可能影响其效果。[查看论文](https://arxiv.org/pdf/2406.02377)**

楠竹11

80 11 11

wljslmz

|

8月前

|

机器学习/深度学习搜索推荐算法

推荐系统算法的研究与实践：协同过滤、基于内容的推荐和深度学习推荐模型

推荐系统算法的研究与实践：协同过滤、基于内容的推荐和深度学习推荐模型

wljslmz

691 1 1

热门文章

最新文章

使用Python实现智能食品推荐系统的深度学习模型

利用Python和机器学习构建电影推荐系统

在数字化时代，推荐系统成为互联网应用的重要组成部分，通过机器学习技术根据用户兴趣和行为提供个性化推荐，提升用户体验

【直播回顾】21天搭建推荐系统：实现“千人千面”个性化推荐（含视频）

「推荐系统」领域近期有哪些值得读的论文？| 每周论文清单

推荐系统-基于矩阵分解的LFM模型

Google提出用对比学习解决推荐系统长尾问题

推荐系统之基于关联规则推荐

工业界常用的推荐系统模型有哪些？

推荐系统[四]：精排-详解排序算法LTR (Learning to Rank)_ poitwise, pairwise, listwise相关评价指标，超详细知识指南。

高并发推荐系统架构设计-1 基本介绍

【AI 初识】解释推荐系统的概念

【Python 机器学习专栏】基于机器学习的推荐系统实现

MATLAB模糊C均值聚类FCM改进的推荐系统协同过滤算法分析MovieLens电影数据集

使用Python实现推荐系统模型

python推荐系统实现（矩阵分解来协同过滤）

Scikit-Learn在推荐系统中的应用

python机器学习：推荐系统实现（以矩阵分解来协同过滤）

音乐发现平台：借助Python和Vue构建个性化音乐推荐系统

【MongoDB】MongoDB在推荐系统中的实践应用

相关课程

更多

使用Redis企业版(Tair)构建实时推荐系统

跟阿里云技术专家学习智能推荐系统

高校精品课-北京大学 -推荐系统

李宏毅2021《机器学习》

南瓜书《机器学习公式推导》

机器学习基础与回归算法

相关电子书

更多

基于E-MapReduce梨视频推荐系统

美团点评高级技术专家郑刚在QCon上做了主题为《美团点评旅游推荐系统的演进》的演讲，就美团点评酒旅业务简介与基于用户画像找回策略演进等进行了深入的分享。

美团点评旅游推荐系统的演进

相关实验场景

更多

使用PAI-快速开始，低代码实现大语言模型微调和部署

推荐系统入门之使用协同过滤实现商品推荐

推荐系统入门之使用ALS算法实现打分预测

下一篇

阿里云无影云电脑免费试用，最长可试用3个月