【推荐系统论文精读系列】(九)--Product-based Neural Networks for User Response Prediction

简介: 预测用户的反应,如点击和转换,是非常重要的,并已发现它在许多网络应用程序中使用,包括推荐系统、网络搜索和在线广告。这些应用程序中的数据大多是分类的,包含多个字段;典型的表示是通过一个热编码将其转换为高维稀疏二进制特征表示。面对极端稀疏性,传统模型可能会限制其从数据中挖掘浅层模式的能力,即低阶特征组合。另一方面,像深度神经网络这样的深度模型由于其巨大的特征空间而不能直接应用于高维输入。在本文中,我们提出了一种基于产品的神经网络(PNN),其嵌入层用于学习分类数据的分布式表示,产品层用于捕获场间类别之间的交互模式,以及进一步的全连接层用于探索高阶特征交互。我们在两个大规模真实世界广告点击数据集上的

@TOC


论文名称:Product-based Neural Networks for User Response Prediction
原文地址:PNN


⚡本系列历史文章⚡


【推荐系统论文精读系列】(一)--Amazon.com Recommendations
【推荐系统论文精读系列】(二)--Factorization Machines
【推荐系统论文精读系列】(三)--Matrix Factorization Techniques For Recommender Systems
【推荐系统论文精读系列】(四)--Practical Lessons from Predicting Clicks on Ads at Facebook
【推荐系统论文精读系列】(五)--Neural Collaborative Filtering
【推荐系统论文精读系列】(六)--Field-aware Factorization Machines for CTR Prediction
【推荐系统论文精读系列】(七)--AutoRec Autoencoders Meet Collaborative Filtering
【推荐系统论文精读系列】(八)--Deep Crossing:Web-Scale Modeling without Manually Crafted Combinatorial Features
【推荐系统论文精读系列】(九)--Product-based Neural Networks for User Response Prediction
【推荐系统论文精读系列】(十)--Wide&Deep Learning for Recommender Systems
【推荐系统论文精读系列】(十一)--DeepFM A Factorization-Machine based Neural Network for CTR Prediction
【推荐系统论文精读系列】(十二)--Neural Factorization Machines for Sparse Predictive Analytics


一、摘要


预测用户的反应,如点击和转换,是非常重要的,并已发现它在许多网络应用程序中使用,包括推荐系统、网络搜索和在线广告。这些应用程序中的数据大多是分类的,包含多个字段;典型的表示是通过一个热编码将其转换为高维稀疏二进制特征表示。面对极端稀疏性,传统模型可能会限制其从数据中挖掘浅层模式的能力,即低阶特征组合。另一方面,像深度神经网络这样的深度模型由于其巨大的特征空间而不能直接应用于高维输入。在本文中,我们提出了一种基于产品的神经网络(PNN),其嵌入层用于学习分类数据的分布式表示,产品层用于捕获场间类别之间的交互模式,以及进一步的全连接层用于探索高阶特征交互。我们在两个大规模真实世界广告点击数据集上的实验结果表明,PNN在各种指标上始终优于最先进的模型。


二、介绍


学习和预测用户响应在信息检索(IR)中的许多个性化任务中起着至关重要的作用,如推荐系统、web搜索和在线广告。用户响应预测的目标是估计用户在给定上下文中提供预定义积极响应的概率,例如点击、购买等。该预测概率表示用户对特定项目(如新闻文章、商业项目或广告帖子)的兴趣,这会影响后续决策,如文档排名和广告竞价。


最近,深度神经网络(DNN)在分类和回归任务中表现出强大的能力,包括计算机视觉、语音识别和自然语言处理。由于DNNs能够自动学习更多的表达性特征表示并提供更好的预测性能,因此在用户响应预测中采用DNNs是很有希望的。为了改进多字段分类数据交互,提出了一种基于因子分解机预训练的嵌入方法。基于级联嵌入向量,构建多层感知器(MLP)来探索特征交互。然而,嵌入初始化的质量在很大程度上受到因子分解机的限制。更重要的是,感知器层的“添加”操作对于探索多个领域中分类数据的交互可能没有用处。以前的工作表明,通过特征向量“乘积”操作而不是“添加”操作,可以有效地探索不同领域特征之间的局部依赖关系。


三、相关工作


响应预测问题通常表示为二元分类问题,预测似然或交叉熵作为训练目标。ROC曲线下面积(AUC)和相对信息增益(RIG)是响应预测准确性的常用评估指标。从建模的角度来看,线性逻辑回归(LR)和非线性梯度提升决策树(GBDT)以及因子分解机(FM)在工业应用中得到了广泛的应用。然而,这些模型在挖掘高阶潜在模式或学习高质量特征表示方面存在局限性。


深度学习能够探索高阶潜在模式以及概括表达性数据表示。DNN的输入数据通常是稠密的实向量,而多场分类数据的求解一直没有得到很好的研究。提出了因子分解机支持的神经网络(FNN),通过预训练的FM学习分类数据的嵌入向量。文献提出了卷积点击预测模型(CCPM),通过卷积神经网络(CNN)预测广告点击。然而,在CCPM中,卷积只在某个对齐的相邻字段上执行,这无法模拟非相邻特征之间的完整交互。利用递归神经网络(RNN)将用户查询建模为一系列用户上下文,以预测广告点击行为。提出了产品单元神经网络(PUNN)来构建输入的高阶组合。然而,PUNN既不能学习局部依赖,也不能产生有界输出以适应响应率。


在本文中,我们展示了PNN模型学习局部依赖和高阶特征交互的方式。


四、深度学习用于CTR评估


我们以在线广告中的CTR估计为例,建立了我们的模型,并探讨了各种指标的性能。任务是建立一个预测模型,以估计用户在给定上下文中点击特定广告的概率。


每个数据样本由多个分类数据字段组成,如用户信息(城市、小时等)、出版商信息(域、广告时段等)和广告信息(广告创意ID、活动ID等)。所有信息都表示为一个多字段分类特征向量,其中每个字段(例如城市)都是一个热编码的,如第一节所述。这种字段式的一个热编码表示会导致维数灾难和极大的稀疏性。此外,字段之间存在局部依赖关系和层次结构。


因此,我们正在寻求一种DNN模型来捕获多领域分类数据中的高阶潜在模式。我们提出了产品层的概念,以自动探索功能交互。在FM中,特征交互被定义为两个特征向量的内积。


提出的深度学习模型称为基于产品的神经网络(PNN)。在本节中,我们将详细介绍PNN模型,并讨论该模型的两种变体,即具有内积层的内积神经网络(IPNN)和使用外积表达式的外积神经网络(OPNN)。



References


[1] A. K. Menon, K.-P. Chitrapura, S. Garg et al., “Response prediction using collaborative filtering with hierarchies and side-information,” in SIGKDD. ACM, 2011, pp. 141–149.


[2] G.-R. Xue, H.-J. Zeng, Z. Chen, Y. Yu, W.-Y. Ma, W. Xi, and W. Fan, “Optimizing web search using web click-through data,” in CIKM, 2004.


[3] W. Zhang, S. Yuan, and J. Wang, “Optimal real-time bidding for display advertising,” in SIGKDD. ACM, 2014, pp. 1077–1086.


[4] X. He, J. Pan, O. Jin et al., “Practical lessons from predicting clicks on ads at facebook,” in Proceedings of the Eighth International Workshop on Data Mining for Online Advertising. ACM, 2014, pp. 1–9.


[5] K.-c. Lee, B. Orten, A. Dasdan et al., “Estimating conversion rate in display advertising from past erformance data,” in SIGKDD. ACM, 2012, pp. 768–776.


[6] A.-P. Ta, “Factorization machines with follow-the-regularized-leader for ctr prediction in display advertising,” in IEEE BigData. IEEE, 2015, pp. 2889–2891.


[7] Y. Cui, R. Zhang, W. Li et al., “Bid landscape forecasting in online ad exchange marketplace,” in SIGKDD. ACM, 2011, pp. 265–273.


[8] Y. LeCun, Y. Bengio, and G. Hinton, “Deep learning,” Nature, 2015.


[9] A. Krizhevsky, I. Sutskever, and G. E. Hinton, “Imagenet classification with deep convolutional neural networks,” in NIPS, 2012, pp. 1097– 1105.


[10] A. Graves, A.-r. Mohamed, and G. Hinton, “Speech recognition with deep recurrent neural networks,” in ICASSP. IEEE, 2013, pp. 6645– 6649.


[11] T. Mikolov, I. Sutskever, K. Chen et al., “Distributed representations of words and phrases and their compositionality,” in NIPS, 2013, pp. 3111–3119.


[12] W. Zhang, T. Du, and J. Wang, “Deep learning over multi-field categorical data: A case study on user response prediction,” ECIR, 2016.


[13] Q. Liu, F. Yu, S. Wu et al., “A convolutional click prediction model,” in CIKM. ACM, 2015, pp. 1743–1746.


[14] M. Richardson, E. Dominowska, and R. Ragno, “Predicting clicks: estimating the click-through rate for new ads,” in WWW. ACM, 2007, pp. 521–530.


[15] T. Graepel, J. Q. Candela, T. Borchert et al., “Web-scale bayesian clickthrough rate prediction for sponsored search advertising in microsoft’s bing search engine,” in ICML, 2010, pp. 13–20.


[16] K. Ren, W. Zhang, Y. Rong, H. Zhang, Y. Yu, and J. Wang, “User response learning for directly optimizing campaign performance in display advertising,” in CIKM, 2016.


[17] Y. Zhang, H. Dai, C. Xu et al., “Sequential click prediction for sponsored search with recurrent neural networks,” arXiv preprint arXiv:1404.5772, 2014.


[18] A. P. Engelbrecht, A. Engelbrecht, and A. Ismail, “Training product unit neural networks,” 1999.


[19] W. Zhang, S. Yuan, and J. Wang, “Real-time bidding benchmarking with ipinyou dataset,” arXiv:1407.7073, 2014.


[20] S. Rendle, “Factorization machines,” in ICDM. IEEE, 2010, pp. 995– 1000.


[21] T. Chen, I. Goodfellow, and J. Shlens, “Net2net: Accelerating learning via knowledge transfer,” in ICLR, 2016.


[22] H. B. McMahan, G. Holt, D. Sculley et al., “Ad click prediction: a view from the trenches,” in SIGKDD. ACM, 2013, pp. 1222–1230

目录
相关文章
|
8月前
|
设计模式 搜索推荐 测试技术
电影推荐系统的设计与实现(论文+系统)_kaic
电影推荐系统的设计与实现(论文+系统)_kaic
|
机器学习/深度学习 搜索推荐 算法
基于协同过滤的旅游推荐系统设计与实现(论文+源码)_kaic
摘要:旅游已经成为了大众节假日放松的主要方式,但因为不熟悉旅游地点带来的选择困难却是不可避免的。随着旅游业的发展旅游行业越来越信息化,用户获取旅游景点信息更加方便。然而,用户在选择旅游目的地时,往往会面对海量的景点信息,这导致他们难以找到适合自己的景点,同时也费时费力 。数量众多的旅游景点存在着信息过载现象且日益严重,用户在网上查找时很难真正搜索到自己感兴趣的旅游景点,对此推荐系统是一种行之有效的解决方法。目前推荐系统已在电影、新闻、音乐、电子商务等方面应用广泛,但在旅游领域还未广泛使用。各大旅游网站多是提供信息查询及订票服务,因此本文将协同过滤算法应用于旅游景点的推荐。
|
机器学习/深度学习 搜索推荐 TensorFlow
【推荐系统】TensorFlow复现论文Wide&Deep网络结构
【推荐系统】TensorFlow复现论文Wide&Deep网络结构
237 0
【推荐系统】TensorFlow复现论文Wide&Deep网络结构
|
SQL 存储 搜索推荐
基于线上考研资讯数据抓取的推荐系统的设计与实现(论文+源码)_kaic
随着互联网的飞速发展,互联网在各行各业的应用迅速成为众多学校关注的焦点。他们利用互联网提供电子商务服务,然后有了“考研信息平台”,这将使学生考研的信息平台更加方便和简单。 对于考研信息平台的设计,大多采用java技术。在设计了一个搭载mysal数据库的全人系统,是根据目前网上考研信息平台的情况,专门开发的,专门根据学生的需要,实现网上考研信息平台的在线管理,并定期进行各种信息存储,进入考研信息平台页面后,即可开始操作主控界面。系统功能包括学生前台:首页、考研信息、申请指南、资料信息、论坛信息、我的、跳转到后台、购物车、客服、管理员:首页、人人中心、研究生信息管理、学生管理、申请指南管理、资料信
|
搜索推荐 安全 关系型数据库
基于知识图谱的个性化学习资源推荐系统的设计与实现(论文+源码)_kaic
最近几年来,伴随着教育信息化、个性化教育和K12之类的新观念提出,一如既往的教育方法向信息化智能化的转变,学生群体都对这种不受时间和地点约束的学习方式有浓厚的兴趣。而现在市面上存在的推荐系统给学生推荐资料时不符合学生个人对知识获取的需求情况,以至于推荐效果差强人意。与此同时,这种信息数字化的新学习方法在给学生群体带来方便的同时,也带来了很多其他的问题,例如信息冗杂、形式让人眼花缭乱的问题,导致系统检索变得难以运行。 解决问题的关键是个性化学习推荐系统,它适合于各式各样的用户产生的各式各样的需求。
|
人工智能 搜索推荐 算法
AAAI 2023杰出论文一作分享:新算法加持的大批量学习加速推荐系统训练
AAAI 2023杰出论文一作分享:新算法加持的大批量学习加速推荐系统训练
301 0
|
搜索推荐 TensorFlow 数据处理
【推荐系统】TensorFlow复现论文PNN网络结构
【推荐系统】TensorFlow复现论文PNN网络结构
133 0
【推荐系统】TensorFlow复现论文PNN网络结构
|
5月前
|
搜索推荐 前端开发 数据可视化
【优秀python web毕设案例】基于协同过滤算法的酒店推荐系统,django框架+bootstrap前端+echarts可视化,有后台有爬虫
本文介绍了一个基于Django框架、协同过滤算法、ECharts数据可视化以及Bootstrap前端技术的酒店推荐系统,该系统通过用户行为分析和推荐算法优化,提供个性化的酒店推荐和直观的数据展示,以提升用户体验。
190 1
【优秀python web毕设案例】基于协同过滤算法的酒店推荐系统,django框架+bootstrap前端+echarts可视化,有后台有爬虫
|
7月前
|
搜索推荐 算法 小程序
基于Java协同过滤算法的电影推荐系统设计和实现(源码+LW+调试文档+讲解等)
基于Java协同过滤算法的电影推荐系统设计和实现(源码+LW+调试文档+讲解等)
|
7月前
|
搜索推荐 算法 小程序
基于Java协同过滤算法的图书推荐系统设计和实现(源码+LW+调试文档+讲解等)
基于Java协同过滤算法的图书推荐系统设计和实现(源码+LW+调试文档+讲解等)

热门文章

最新文章