开发者社区> 程序员对白> 正文

推荐系统序列化建模总结(二)

简介: 推荐系统序列化建模总结(二)
+关注继续查看

3.5 CIKM’20 京东 | Deep Multifaceted Transformers for Multi-objective Ranking in Large-Scale E-commerce Recommender Systems [2]


  • 问题背景:已有工作缺少对用户多种行为的利用,缺少对多任务的建模,缺少对场景Bias的建模。


  • 业务场景:商品搜索排序阶段


  • 特征方面:使用了点击,加购,成交3个Item Sequence,分别表征短期,中期和长期兴趣;对连续型数值特征使用了Z-score归一化;Bias Deep Neural Network中使用了Neighbor Feature,即商品展示时周围的商品信息,他们会影响用户对商品的点击。


  • 模型方面


e72e66564aad05a46a8b4fe490b19d11.png


DMT


  • 序列建模部分使用Self Attention+Target Attention,位置编码通过sin-cos或可学习的方式生成。


  • 多任务建模部分使用MMOE,相比较简单共享底层Embedding,MMOE相当于学习了一组“基”Embedding(划分多个Expert),然后通过Gate机制为每个任务针对性的加权组合“基”Embedding。


  • Bias建模部分使用Bias特征+MLP,输出的Logits与主网络Logits相加。


3.6 AAAI’20 阿里 | Deep Match to Rank Model for Personalized Click-Through Rate Prediction [17]


  • 问题背景:已有工作更关注对User Embedding的表达,而没有关注到User和Item的相关性,该相关性可以更直接地反映User对Item的偏好。个人理解是,DIN等模型将学习到的Sequence Embedding(用户兴趣向量)与User Profile,待排序物品特征等Concat后送入最上层的MLP进行特征交叉最终输出一个CTR预估分数,作者认为在Concat特征送入MLP进行交叉前就计算一个User和Item相关性可以降低模型的学习难度。


  • 业务场景:商品推荐排序阶段


  • Feature Representation:将召回得分也作为了排序时的特征。


7613e1970753803c3c8244a06c1825b9.png


DMR


  • User-to-Item Network



1.png


b31870404cf2c9240248f1ff7d767a56.png

68040f2550d42f177c582beb5e91e7fb.png



  • 是位置特征, 是Item特征,这里用序列中Item自身特征学习其重要性总感觉有点奇怪,不过换个角度将随机初始化的z作为一个与任务相关的Query,最终重要性则取决于与该Query的相关性。


  • 对行为序列加权求和后得到User Embedding u,再将该Embedding与待排序的Item v计算点积r作为相关性特征。不过在一个上千维的Concat特征中多一个一维的相关性特征真的有效吗?


  • Auxiliary match network


09c6d36102e82f2136bc044fee6b73f6.png


Auxiliary match network


  • 这里是用行为序列中前T-1个Item表征用户,然后用该表征去召回第T个Item(类似于DIEN的Auxiliary Loss的特殊形式)。


  • 这里其实相当于一个召回过程。召回和排序是工程上的折中,召回阶段模型简单但打分域大,模型见识过的数据多,排序阶段模型复杂但打分域小,模型见识过的数据少。将召回过程引入排序阶段,扩大了模型的打分域(体现在负采样),让模型见过了更多样本从而表达能力更强,但是线上部署恐怕是个问题。


  • Item-to-Item Network


f485bd0dbcd380dd891b784d90e98117.png


Item-to-Item Network


  • 加性模型计算Attention,用到了待排序的Item特征,属于Target Attention。


  • Target Item的Embedding和Sequence Item的Embedding不是共享的。


  • 将未经softmax归一化的Attention之和作为另一个User和Item的相关性分特征。


3.7 AAAI’21 腾讯 | U-BERT: Pre-training User Representations for Improved Recommendation [4]


[外链图片转存中…(img-PKHOQRkc-1635863814266)]


U-BERT


这篇论文主要是用BERT对Review(评论)数据进行预训练,加入了领域相关的特征,加入了特征互交叉的操作,在数据集比较小的目标领域上取得了不错的效果,但是对于像手淘搜索这样的大流量场景,预训练的方式想要取得效果可能不太容易。


3.8 IJCAI’19 阿里 | Deep Session Interest Network for Click-Through Rate Prediction [6]


  • 问题背景:序列可以被划分为多个Session(一个时间窗口),Session内的Item是同构的,Session间的Item是异构的。例如,用户在一个Session内购买了衣服,裤子,鞋等,在另一个Session内购买了switch,便携屏,投影仪等。直接对整个行为序列用RNN或Attention模型建模会存在问题。


[外链图片转存中…(img-5VZxIz3p-1635863814267)]


Session


  • 业务场景:商品推荐排序阶段


  • Session Division Layer:将行为序列按照30分钟的时间窗口划分为多个Session。


a6b29330f637a51073838c38dbe22b8c.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
领域场景分析的6W模型
领域场景分析的6W模型
24 0
时序电路建模基础
⭐本专栏针对FPGA进行入门学习,从数电中常见的逻辑代数讲起,结合Verilog HDL语言学习与仿真,主要对组合逻辑电路与时序逻辑电路进行分析与设计,对状态机FSM进行剖析与建模。
15 0
学3D建模需要什么基础?
简单来说,学习3D建模大概需要两个基础。 一是美术基础。建模师需要了解人体结构,像是肌肉线条、皮肤纹理之类的;然后还需要一定的 审美能力,没有审美怎么能制作出好看的模型呢?所以审美也很重要。 二是电脑使用基础。学习建模会接触到不少应用软件的学习,建模常用的软件有3DMax、 MAYA、C4D、ZBrush等。也不是需要全部都学会,学会其中几个必要的,用着顺手的就行。
173 0
建模,没必要
Eric在DDD第一章节就介绍了模型,可见模型的作用不言而喻,说DDD是一种模型驱动设计方法,绝对没有问题 那是不是我们在拿到业务需求时,就急呼呼的跟业务方来一起构造模型呢?毕竟模型是万事之首嘛 在《DDD开篇》[1]提过DDD是一种基于面向对象的设计方法,我们既然已经有了面向对象,而且OOAD也很强大,为什么还需要DDD呢? 要想弄清楚这两个问题,首先我们需要拿个示例来仔细比对一下
40 0
【数据挖掘算法】(二)MSET 算法参差分析
【数据挖掘算法】(二)MSET 算法参差分析
183 0
推荐系统序列化建模总结(三)
推荐系统序列化建模总结(三)
233 0
推荐系统序列化建模总结(一)
推荐系统序列化建模总结(一)
386 0
数据分析八大模型:详解RFM模型
今天跟大家分享的是一个经常被提及,但是价值被严重低估的模型:RFM模型。
451 0
【数据挖掘】数据挖掘算法 组件化思想 ( 模型或模式结构 | 数据挖掘任务 | 评分函数 | 搜索和优化算法 | 数据管理策略 )
【数据挖掘】数据挖掘算法 组件化思想 ( 模型或模式结构 | 数据挖掘任务 | 评分函数 | 搜索和优化算法 | 数据管理策略 )
290 0
简述推荐系统中的矩阵分解
简述推荐系统中的矩阵分解
35 0
+关注
程序员对白
微信公众号:对白的算法屋,分享AI前沿算法和技术干货,回复「对白笔记」,即可领取我的原创算法笔记和工作心得。
文章
问答
文章排行榜
最热
最新
相关电子书
更多
典型模型-卷积神经网络入门
立即下载
典型模型-卷积神经网络入门 从概念原理到应用实现
立即下载
大规模稀疏化模型技术介绍及实践
立即下载