【前沿解读】17篇2023淘天业务技术A类顶会论文(下)

简介: 【前沿解读】17篇2023淘天业务技术A类顶会论文(下)

【前沿解读】17篇2023淘天业务技术A类顶会论文(上):https://developer.aliyun.com/article/1443503



论文标题:

A Feature-Based Coalition Game Framework with Privileged Knowledge Transfer for User-tag Profile Modeling  基于特征和优势知识迁移的联盟博弈用户画像建模框架



论文简介:

在电商平台上,理解消费者兴趣偏好至关重要。我们提出了一个基于特征和优势知识迁移的联盟博弈用户画像建模框架。我们在用户画像建模中引入了两种特征,一种是联盟特征(Coalition Feature),另一种是优势特征(Privileged Feature)。我们使用夏普利值(sharply value)去刻画联盟特征中每个特征对整体的贡献程度。对于优势特征,我们使用优势知识迁移模块(Privileged Knowledge Mapping)去映射优势特征,同时也使用自适应多视角映射模块(Adaptive Multi-View Mapping)来增强模型对丰富的优势知识的捕获程度。我们在2个公开数据集(MovieLens、Delicious)以及一个私有数据集(Taobao)证明了我们模型的优势。同时我们也在线上部署了我们的用户偏好模型,收获了10.81%的主题CTR(Theme-CTR)提升以及6.74%的商品CTR(Item-CTR)提升。


下载地址:

https://dl.acm.org/doi/pdf/10.1145/3580305.3599761


论文标题:

Controllable Multi-Objective Re-ranking with Policy Hypernetworks

可控多目标融合的重排序模型



论文简介:

多阶段排序已成为现代推荐系统中广泛使用的策略,其中最终阶段决定推荐序列,这个序列需要平衡多个目标,如用户偏好、多样性、新颖性等。线性标量化(Linear scalarization)是最广泛使用的多目标融合技术,它通过线性加权求和的方式,将多个目标融合成一个。现有的最终阶段排序方法通常采用静态模型,其中偏好权重在离线训练期间确定,并在在线服务期间保持不变。每当需要修改偏好权重时,就必须重新训练模型,这在时间和资源上都是低效的。同时,对于不同的目标用户群体或不同的时间段(例如,在假日促销期间),最合适的权重可能会有很大的变化。在本文中,我们提出了一个名为可控的多目标重排(CMR)框架,该框架结合了超网络,根据不同的偏好权重生成重排模型的参数。通过这种方式,CMR能够根据在线环境的变化为各种权重生成最优序列,而无需重新训练模型。此外,我们将实际的面向业务的任务分为四个主要类别,并将它们合并到基于Actor-Evaluator框架的重排模型中,该框架可作为CMR的可靠实际测试平台。基于淘宝App数据集的离线实验表明,CMR通过将几种流行的重排模型作为底层模型进行了改进。在线A/B测试也证明了CMR的有效性和可信度。


下载地址:https://arxiv.org/pdf/2306.05118.pdf


论文标题:MAMDR: A Model Agnostic Learning Framework for Multi-Domain RecommendationMAMDR:一种模型结构无关的多领域推荐学习框架论文简介:现实世界中的大型电子商务平台通常包含多种推荐场景(领域),以满足不同顾客群体的需求。多领域推荐(MDR),旨在共同提升所有领域的推荐效果,该方向受到越来越多的从业者和研究人员的关注。现有的MDR方法通常采用共享结构和一些特定组件来共享特征和领域特定信息。然而不同领域之间的数据分布差异,使得开发一个适用于所有情况的通用模型成为挑战。此外,在训练过程中,共享参数经常受到领域冲突的影响,而特定参数则容易在数据稀疏领域过拟合。为了解决这些问题,我们提出了一种针对多领域推荐的模型无关学习框架MAMDR。该框架解决了多领域推荐中存在的领域冲突和过拟合问题。具体来说,MAMDR包括领域协商(DN)和领域正则化(DR)两个策略,通过最大化不同领域之间的梯度内积来减轻领域冲突,并使用其他领域的数据优化特定领域的参数,从而提高各领域的泛化能力。最后,我们在淘宝应用中实现了MAMDR的分布式应用,并构建了各种公共的MDR基准数据集,这些数据集可以用于后续研究,实验也表明了MAMDR的有效性和通用性。


论文下载:

https://arxiv.org/pdf/2202.12524.pdf



WWW2023


论文标题:

Deep Intention-Aware Network for Click-Through Rate Prediction

即时意图感知的多任务排序模型



论文简介:

营销场作为首页流量分发的二级入口,具有以品带场的特点。其CTR预估问题可以归纳为给定用户和所见即所得商品(trigger item)进行商品推荐。在此场景下,我们需要识别用户进入营销场的意图(即被所见所得商品吸引还是对营销场本身感兴趣),并针对不同情况进行差异化建模。

基于此,我们提出了即时意图感知的多任务排序模型((Deep Intention-Aware Network, DIAN),在聚划算、天天特卖和有好价等场景都取得较大的提升。


论文下载:

https://arxiv.org/pdf/2211.08650.pdf


论文标题:

Continual Transfer Learning for Cross-Domain Click-Through Rate Prediction at Taobao

连续迁移学习用于淘宝的跨域点击率预估



论文简介:

论文探讨了如何在工业界的连续学习的框架下实现跨域(跨场景)推荐,针对工业推荐场景下模型需持续不断更新,迁移学习也需要持续进行的这一特点带来的挑战,提出了连续迁移学习这一新的跨域推荐范式,并提出了连续迁移网络(CTNet)模型用于淘宝的跨域点击率预估。CTNet利用连续预训练的源域模型的中间层表征结果作为目标域模型的额外知识,该模型可以复用过去已充分学习得到的模型参数以实现高效的跨域知识迁移。论文提出的方法在淘宝的真实数据集和线上A/B测试都取得了对比一系列最新的跨域推荐方法的在效果和效率上的显著优势,从2021年12月起已在有好货推荐系统全量上线,并持续取得显著业务效果,相关方法后续也在淘天集团的多个业务场景上落地并取得效果。


论文下载:https://arxiv.org/pdf/2208.05728.pdf

CHI2023


论文标题:

Layout Generation for Various Scenarios in Mobile Shopping Apps

移动购物应用程序中多种场景下的布局生成



论文简介:

布局对于移动购物应用程序中的商品展示页面是必不可少的。为了清晰地向消费者传达商品信息并实现特定的功能,商品展示页面的布局通常会根据场景进行多种变化。在这项工作中,我们研究了不同场景下商品展示页面的布局设计,并提出了一个设计空间来指导大规模的商品展示页面设计。此外,我们提出了一种全新的在内部和外部约束下生成布局的模型,LayoutVQ-VAE。LayoutVQ-VAE学习布局的离散潜在表示,并且可以在不应用启发式的情况下对布局潜在表示和场景之间的关系进行建模。在文档布局、UI布局等多个不同类型的公开布局数据集上的实验验证了我们的方法与目前最先进的方法相比表现更优或相当。用户研究则进一步表明我们所提出的包括设计空间和生成模型的方法可以有效地为移动购物平台制作大规模的高质量商品展示页面布局。



论文下载:

https://dl.acm.org/doi/10.1145/3544548.3581446



WSC2023


论文标题:

A Deep Q-Network Based on Radial Basis Functions for Multi-Echelon Inventory Management

一种用于多级库存管理的基于径向基函数的深度Q网络



论文简介:

本文解决了具有复杂网络拓扑的多级库存管理问题。过往的方法在该网络拓扑中很难得出最佳订货决策。深度强化学习 (DRL) 最近展示出解决此类问题的潜力,但在 DRL 中设计神经网络仍然是一个挑战。为了解决该问题,本文构建了一种 DRL 模型,其 Q 网络基于radical基函数。与基于神经网络的经典 DRL 模型相比,该方法可以更容易地构建,从而减轻超参数优化的计算负担。通过一系列的仿真实验,证明了该方法在解决base-stock策略优化问题的卓越性能,在多级网络中发现了更好的策略,并在串行结构中base-stock策略寻优中表现出色。此外,该方法优于当前的 DRL 方法。


论文下载:




INFORMS2023


论文标题:AI vs. Human Buyers: A Study of Alibaba’s Inventory Replenishment System  

AI vs 人工买手:库存补货系统的研究



论文简介:

库存管理是自营零售业务最重要的环节之一。传统上,补货决策是由库控或者买手做出的:尽管算法会提出建议,但人工可以选择忽略并做出自己的决定。团队一直在探索一种新的补货系统,希望算法建议最终被采纳。这些算法将最先进的深度强化学习技术与fictitious play的框架相结合。通过了解供应商的行为,我们能够解决订单数量的交货时间和履行率这些重要的内生性问题,这是现有的随机库存控制文献尚未研究的。我们提供的证据表明,我们的算法在降低缺货率和库存水平方面优于人工决策。更有趣的是,我们在疫情期间看到了额外的领先之处。过去3年,国内的城市(部分)间歇性封锁,以缓解 COVID-19 的爆发。我们观察到封锁期间人工决策中有恐慌性购买的行为,导致了牛鞭效应 (Bullwip effect)。相比之下,在我们的算法下,恐慌性购买和牛鞭效应可以得到缓解,因为它们能够捕捉供应商在封锁期间行为的变化。


论文下载:https://www.researchgate.net/publication/363771757_AI_vs_Human_Buyers_A_Study_of_Alibaba%27s_Inventory_Replenishment_System

SIGIR2023


论文标题:

U-NEED: A Fine-grained Dataset for User Needs-Centric E-commerce Conversational Recommendation

U-NEED:一个以用户需求为中心的电子商务对话推荐的细粒度数据集


论文简介:

对话推荐系统(CRSs)的目标是理解对话中表达的信息需求和偏好,以向用户推荐适合的商品。大多数现有的对话推荐数据集是通过众包合成或模拟的,与现实世界的场景存在很大差距。为了弥补这一差距,前期工作贡献了一个基于电子商务场景中用户与客服人员之间的售前对话的数据集E-ConvRec。然而,E-ConvRec只提供了粗粒度的标注和用于售前对话推荐的通用任务。与之不同的是,我们使用真实的用户需求作为线索,探索电子商务对话推荐中的复杂售前对话,即以用户需求为中心的电子商务对话推荐(UNECR)。在本文中,我们从现实世界的电子商务场景中构建了一个以用户需求为中心的电子商务对话推荐数据集(U-NEED)。U-NEED由3种类型的资源组成:(i)5个TOP类目中的7,698个细粒度标注的售前对话session数据(ii)333,879条用户行为数据和(iii)332,148条商品知识图谱三元组数据。为了促进UNECR的研究,我们提出了5个关键任务:(i)售前对话理解(ii)用户需求引导(iii)基于用户需求的推荐(iv)售前对话生成和(v)售前对话评估。我们为每项任务建立了基准方法和评估指标。我们报告了在U-NEED上5个任务的实验结果,并重点分析了3个典型类目的实验结果,实验表明,UNECR在不同类目中的挑战是不同的。


论文下载:https://arxiv.org/pdf/2305.04774.pdf


TNNLS2023

论文标题:Noah: Reinforcement-Learning-Based Rate Limiter for Microservices in Large-Scale E-Commerce Services   Noah: 基于强化学习的电商系统大规模微服务限流器论文简介:现代大型在线服务提供商通常将微服务部署在容器中以实现灵活的服务管理。在基于容器的微服务架构中,一个关键问题是控制请求流量到达容器的速率,以避免容器过载。在本文中,我们分享了在阿里巴巴的容器速率限制的经验,阿里巴巴是世界上最大的电子商务服务之一。鉴于阿里巴巴容器的高度多样性特点,我们指出现有的速率限制机制无法满足我们的需求。因此,我们设计了Noah,这是一个动态流量速率限制器,可以自适应每个容器的具体特性而无需人工干预。Noah的核心思想是使用深度强化学习(DRL),自动推断出每个容器最合适的配置。为了在我们的场景中充分利用DRL的优势,Noah解决了两个技术挑战。首先,Noah使用轻量级的系统监控机制来收集容器状态。通过这种方式,它在确保及时响应系统负载变化的同时,最小化了监控开销。其次,Noah在训练其模型时注入合成的极端数据。因此,它的模型获得了关于未见过的特殊事件的知识,从而在极端情况下保持高可用性。Noah已经在阿里巴巴的生产环境中部署了两年,服务于超过50,000个容器和大约300种类型的微服务应用。实验结果表明,Noah可以很好地适应生产环境中的三种常见场景;与四种最新的速率限制器相比,它有效地实现了更好的系统可用性和更短的请求响应时间。

论文下载:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=10098822&tag=1

目录
相关文章
|
18天前
|
机器学习/深度学习 编解码 算法
【前沿解读】17篇2023淘天业务技术A类顶会论文(上)
【前沿解读】17篇2023淘天业务技术A类顶会论文(上)
132 2
|
12月前
|
人工智能 算法 机器人
如何解锁大模型时代AI研究开发新范式 ?尽在2023WAIC AI开发者领袖论坛
如何解锁大模型时代AI研究开发新范式 ?尽在2023WAIC AI开发者领袖论坛
103 0
|
人工智能 安全 算法
可信联邦学习线上分享:杨强教授带领四篇论文解读最前沿研究
可信联邦学习线上分享:杨强教授带领四篇论文解读最前沿研究
|
机器学习/深度学习 算法 数据可视化
上海交大团队使用联合深度学习优化代谢组学研究
上海交大团队使用联合深度学习优化代谢组学研究
158 0
|
机器学习/深度学习 存储 敏捷开发
斯坦福教授曼宁AAAS特刊发文:大模型已成突破,展望通用人工智能
斯坦福教授曼宁AAAS特刊发文:大模型已成突破,展望通用人工智能
127 0
|
机器学习/深度学习 Web App开发 算法
伦敦大学学院、UC伯克利联手,撰文综述深度强化学习泛化研究
伦敦大学学院、UC伯克利联手,撰文综述深度强化学习泛化研究
|
机器学习/深度学习 人工智能 边缘计算
AI、6G与元宇宙?爱尔兰东理发表最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述
AI、6G与元宇宙?爱尔兰东理发表最新《人工智能和6G与元宇宙:基本原理、挑战和未来研究趋势》综述
|
机器学习/深度学习 人工智能
AI:2020年6月24日北京智源大会演讲分享之强化学习专题论坛——11: 40-12: 10俞扬教授《更好的环境模型,更好的强化学习》
AI:2020年6月24日北京智源大会演讲分享之强化学习专题论坛——11: 40-12: 10俞扬教授《更好的环境模型,更好的强化学习》
AI:2020年6月24日北京智源大会演讲分享之强化学习专题论坛——11: 40-12: 10俞扬教授《更好的环境模型,更好的强化学习》
|
人工智能 计算机视觉 Python
AI已经参与论文打假了
AI已经参与论文打假了
118 0
AI已经参与论文打假了
|
机器学习/深度学习 人工智能 自然语言处理
年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势(上)
本文节选自机器之心《2021-2022年度 AI科技发展趋势报告 · 研究篇》,详细数据及分析过程在完整报告中进行收录。报告将于2022年开春正式发布,点击阅读原文获得免费获取报告机会。
256 0
年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势(上)