带你读《2022技术人的百宝黑皮书》——SIGIR2022 | 流行度偏差如何利用? 探索解耦域适应无偏召回模型(2)

简介: 带你读《2022技术人的百宝黑皮书》——SIGIR2022 | 流行度偏差如何利用? 探索解耦域适应无偏召回模型(2)

带你读《2022技术人的百宝黑皮书》——SIGIR2022 | 流行度偏差如何利用? 探索解耦域适应无偏召回模型(1) https://developer.aliyun.com/article/1247004?groupCode=taobaotech




方法


image.png

图2:推荐过程的因果图表示,U-用户;I-商品;P-流行度;C-点击概率。


如图2a因果图所示,当前的训练范式会使得流行度信息不仅会影响用户的点击,还会被注入商品id表征中,从而加剧流行度偏差。因此,我们设计模型如图2b红线所示,从商品属性表征中解耦出原始的内容表示和流行度表示。具体来说,我们设计了可以联合训练有偏模型和无偏模型的解耦域适应网络 ,其难点在于如何提取无偏且学习充分的商品表示。针对流行度分布差异,我们设计了特征解耦模块(FDM)从商品属性embedding分离出属性表示和流行度表示;针对长尾分布差异,我们额外引入未曝光商品(大多数为长尾商品)来实现热门商品和长尾商品分布粒度上的对齐,进一步的,利用I2I范式,我们基于用户行为序列,设计商品相似度损失函数促使越相似的商品有越相似的商品向量表示,实现实例粒度上的对齐。接下来,我们将具体介绍我们的模型结构。


image.png


图3:image.png 网络结构图。分别表示目标商品,未曝光商品,用户行为序列商品。在训练阶段,FDM用来学习分离商品属性表示和商品流行度表示。此外,我们在商品塔额外引入未曝光样本和用户历史行为序列来缓解长尾分布差异。image.png 可以训练一个模型通过无偏的商品属性表示 ,image.png和一个有偏的模型通过融合了真实流行度表示的image.png 的有偏商品表示image.png


Embedding Layer


整体模型为双塔结构:用户塔通过用户信息 image.png和历史行为序列 image.png生成用户向量表示image.png ;商品塔通过商品信息 image.png和流行度信息 image.png生成商品向量表示 image.png。其中用户信息包含性别、年龄、省份等;商品信息包含商品id,

类目,品牌等;流行度信息包含曝光频率,点击频率,购买频率等。 image.png通过编码层将其转化为编码向量:


image.png


本次工作的重点在于如何改造商品塔来提取符合预期的商品向量表示image.png



带你读《2022技术人的百宝黑皮书》——SIGIR2022 | 流行度偏差如何利用? 探索解耦域适应无偏召回模型(3) https://developer.aliyun.com/article/1247001?groupCode=taobaotech

相关文章
|
算法 搜索推荐 安全
淘宝信息流融合混排服务升级
淘宝信息流融合混排服务升级
1371 1
Springboot之Thymeleaf 表单提交
Springboot之Thymeleaf 表单提交
868 0
|
12月前
|
Ubuntu NoSQL 编译器
在Ubuntu 20.04上构建RISC-V和QEMU环境
以上的步骤只是开始,RISC-V的世界里有无数的未知等待你去探索。加油,勇敢的探险家。
758 18
|
机器学习/深度学习 存储 人工智能
转载:【AI系统】计算之比特位宽
本文详细介绍了深度学习中模型量化操作及其重要性,重点探讨了比特位宽的概念,包括整数和浮点数的表示方法。文章还分析了不同数据类型(如FP32、FP16、BF16、FP8等)在AI模型中的应用,特别是FP8数据类型在提升计算性能和降低内存占用方面的优势。最后,文章讨论了降低比特位宽对AI芯片性能的影响,强调了在不同应用场景中选择合适数据类型的重要性。
转载:【AI系统】计算之比特位宽
|
C# 图形学
unity抛物线的制作
该教程展示了如何在Unity中使用LineRenderer组件和C#脚本绘制抛物线。具体步骤如下:创建一个空物体并添加LineRenderer组件,挂载提供的`SeletParabola`脚本;新建两个Cube作为起点和终点,并将其拖到脚本对应的公共变量上。运行后即可看到从起点到终点的抛物线效果。代码通过计算抛物线上的点并设置给LineRenderer来实现这一效果。此外,还可以为LineRenderer添加贴图以增强视觉效果。
|
JavaScript 前端开发 CDN
vue-video-player基本使用
vue-video-player 是基于vue的 视频播放器,可以便捷的适配到项目中
1380 1
|
资源调度 JavaScript
vue-cli3+webpack热更新失效问题
A项目中遇到问题,热更新失效,百思不得其解,查询搜索vuecli3热更新失效、vue histroy 模式热更新失效,网上看到不少方法,npm重新安装,不要用淘宝镜像cnpm安装;npm安装yarn,再用yarn重新install,yarn serve启动,在npm run serve 启动等方法都不好用。github有类似问题3.0.0-beta.16 热更新失效 · Issue #1559 · vuejs/vue-cli · GitHub,有次得到启发可能版本不同导致。 对比热更新正常的项目B的几个配置文件,重点查看package.json文件,发现有webpack版本不同。
822 0
vue-cli3+webpack热更新失效问题
|
搜索推荐 算法
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2)
带你读《2022技术人的百宝黑皮书》——冷启动系统优化与内容潜力预估实践(2)
474 1
|
编解码 Java 测试技术
基于Sikuli GUI图像识别框架的PC客户端自动化测试实践
Sikuli是一款基于GUI图像识别框架的自动化测试工具,它以图像检索技术为基础,提供了一套基于 Jython 的脚本语言以及集成开发环境。使用者可利用屏幕截图直接 引用 GUI 元素进行编程,完成交互操作。Sikuli 一词取自墨西哥的土著语,意为“上帝之眼”,寓意—— Sikuli 让电脑能像人一样”看”这个”真实世 界”。
基于Sikuli GUI图像识别框架的PC客户端自动化测试实践
|
机器学习/深度学习 自然语言处理 算法
深度粗排在天猫新品中的实践
深度粗排在天猫新品中的实践
1083 0
深度粗排在天猫新品中的实践