深度学习-点击率预估-研究论文2024-09-14速读
1. Deep Target Session Interest Network for Click-Through Rate Prediction
H Zhong, J Ma, X Duan, S Gu, J Yao - 2024 International Joint Conference on Neural Networks, 2024
深度目标会话兴趣网络用于点击率预测
摘要:
这篇文章提出了一种新的深度学习模型,名为Deep Target Session Interest Network(DT-SIN),用于提高点击率(CTR)预测的准确性。该模型特别关注用户会话中的行为序列,通过捕捉用户在会话期间的动态兴趣变化来预测点击行为。DT-SIN模型利用了注意力机制来加权用户会话中的不同项目,并结合了用户的历史行为和上下文信息来提高预测的准确性。
创新点:
- 提出了一种新的用户会话表示方法,能够捕捉用户在会话期间的兴趣演变。
- 引入了注意力机制来加权用户会话中的项目,使得模型能够关注更相关的用户行为。
- 结合了用户的历史行为和上下文信息,以提供更全面的用户画像,从而提高CTR预测的准确性。
算法模型:
DT-SIN模型包括以下几个关键组件:
- 会话兴趣提取器:用于从用户会话中提取兴趣表示。
- 注意力机制:用于加权会话中的不同项目,以突出用户最感兴趣的部分。
- 用户画像构建器:结合用户的历史行为和上下文信息来构建用户画像。
- 预测器:基于用户画像和会话兴趣来预测点击行为。
实验效果:
文章中进行了一系列的实验来评估DT-SIN模型的性能。实验结果表明,与现有的CTR预测模型相比,DT-SIN在多个数据集上都取得了更好的性能。具体来说,DT-SIN在AUC(Area Under the Curve)和Logloss等评价指标上均优于其他模型。实验数据和结论证明了DT-SIN在处理复杂的用户行为序列和提高CTR预测准确性方面的有效性。
推荐阅读指数:
★★★★☆
这篇文章对于那些对推荐系统、用户行为分析和深度学习在CTR预测应用感兴趣的研究人员和实践者来说是非常有价值。它提供了一种新的视角来理解和预测用户的点击行为,并且通过实验验证了其有效性。因此,我给予这篇文章较高的推荐指数。
2. DeepFM: A Factorization-Machine based Neural Network for CTR Prediction
Huifeng Guo, Ruiming Tang, Yunming Ye, Zhenguo Li, Xiuqiang He, 2017
DeepFM:一种基于分解机的神经网络用于点击率预测
摘要:
文章提出了DeepFM模型,这是一个结合了分解机(Factorization Machines, FM)和深度神经网络(Deep Neural Networks, DNN)的端到端学习模型,用于提高推荐系统中的点击率(CTR)预测准确性。DeepFM模型能够同时捕捉低阶和高阶特征之间的复杂交互,并且不需要除了原始特征之外的任何特征工程。通过在基准数据集和商业数据上的全面实验,证明了DeepFM在CTR预测方面的有效性和效率,与现有模型相比有显著提升。
创新点:
- 提出了DeepFM模型,它整合了FM和DNN,能够同时学习低阶和高阶特征交互。
- 与Google的Wide & Deep模型相比,DeepFM的“宽”和“深”部分共享相同的输入,无需特征工程。
- 实现了高效的训练,因为其宽部分和深部分共享相同的输入和嵌入向量。
算法模型:
DeepFM模型包括两个主要组件:
- FM组件:用于捕捉特征之间的二阶交互。
- DNN组件:用于捕捉更高阶的特征交互。
这两个组件共享相同的输入特征,并且模型的参数是联合训练的。模型的输出是CTR的预测值,通过sigmoid函数得到。
实验效果:
在Criteo数据集和商业数据集上进行了实验,评估指标包括AUC(Area Under the ROC Curve)和Logloss(交叉熵损失)。实验结果显示,DeepFM在两个数据集上都优于现有的模型,包括FM、FNN、PNN变体、Wide & Deep模型等。具体来说,在商业数据集上,DeepFM在AUC上比LR模型提高了0.86%,在Logloss上降低了0.42%;在Criteo数据集上,DeepFM在AUC上提高了0.37%,在Logloss上降低了0.29%。
推荐阅读指数:
★★★★☆
这是一篇CTR预估领域比较有影响力的论文。该文章对于从事推荐系统、广告技术、机器学习等领域的研究者和工程师来说非常有价值。它不仅提出了一个新的模型,而且在实际数据集上展示了其优越的性能。因此,我给予这篇文章较高的推荐指数。