独家下载!《SIGIR 顶会论文解读》电子书重磅发布

简介: 高端玩家看过来!阿里云开发者社区联合新零售智能引擎事业群独家推出顶会论文解读系列电子书,本期为《SIGIR 顶会论文解读》,由 7 位阿里巴巴技术专家精心打造,深度解析信息检索新技术,助你了解行业动态,紧跟技术潮流!

点此查看第一期:《KDD论文精华解读》

《SIGIR 顶会论文解读》重磅发布

由 7 位阿里巴巴技术专家精心打造,内容覆盖推荐系统 、成交转化模型 、 回音室效应 、 全空间多任务转化率预估建模 、 DeepMatch 召回模型 、 跨领域冷启动用户推荐网络 、 表示学习模型等信息检索领域新技术。

点击下载

>>《SIGIR 顶会论文解读》<<

或者复制该链接到浏览器完成下载或分享:https://developer.aliyun.com/topic/download?id=724



SIGIR顶会论文解读.jpg

精彩内容抢先看

image.png

1、对抗推荐系统
回顾推荐系统的发展,离不开模型、数据、训练方式三个维度的创新。模型层面,基于内容的推荐系统到协同过滤的矩阵分解,以及神经网络带来的序列化建模,使得用户表征和商品表征刻画越来越精细;数据层面,长短期行为的切分,基于session 的推荐 [1],跨场景行为的引入,数据的丰富和建模为用户兴趣的挖掘提供更多的可能;训练方式上,分布式训练框架,在线学习,高维稀疏特征处理,优化器设计,从而支撑商业化推荐系统。然而,性能提升的同时,我们也看到推荐系统的可解释性逐渐变成黑盒。用户的兴趣偏好如何表征,兴趣如何演变,不同时间点的历史行为由哪种因素主导,这一系列的问题都对现代化推荐系统的解释提出了挑战。
2、GMCM基于微观行为图的成交转化模型
电商推荐系统帮助用户寻找感兴趣的商品。在这个系统中,两个任务扮演了至关重要的角色,点击率预估(CTR Estimation)和成交转化率预估(CVREstimation)。顾名思义,点击率是商品从被曝光到被点击的概率,成交转换率是商品从被点击到被购买的概率。
虽然学界和业界在 CVR预估方面做了不少有意义的工作,但是工业应用中的 CVR预估仍然是个有挑战性的任务。
3、属性二部图的表示学习
网络数据是一种常见的数据表示形式,可以用来建模现实世界中的多种应用场景。网络表示学习(又称作图嵌入学习),作为一种建模网络数据的模型,近年来受到学界和工业界的广泛重视,得到了极大发展。网络表示学习旨在把复杂的网络图数据结构嵌入到低维的连续向量空间中,并且使每一个节点的特征信息在低维空间中得到反馈。近年来,大量的网络表示学习方法和模型被不断提出并且在链路预测、节点分类、网络可视化等相关的实际任务上有很好的表现指标。
4、了解电子商务中的回音室效应
个性化推荐系统在为用户带来更精准商品的同时,也对消费者的兴趣偏好和行为造成影响,例如回音室效应。回音室是指用户不断接受相似的信息和内容, 从而使得他们的兴趣或者态度被不断强化。这种现实通常出现在社交媒体和网络平台,也同样可能出现在电子商务等推荐系统中。我们的研究集中在电子商务的推荐系统对用户兴趣的影响,利用淘宝的大规模用户数据检验是否存在回音室效应。
5、基于post-click行为分解的全空间多任务转化率预估建模
随着移动互联网的兴起,从海量的数据中挖掘出有价值的信息并呈现给用户,已成了电商、社交、新闻等主流应用的核心功能,推荐系统正是在这样的背景下诞生的。在电商领域,高质量的推荐系统能为用户提供精准、及时、甚至带有一定惊喜性的个性化服务,进而有效地增加了用户与系统之间的黏性,同时也能为平台带来一定的收入。一般说来,电商领域 ( 如淘宝 ) 的推荐系统架构主要包括两个阶段:系统决策和用户决策。
6、一种挖掘用户评论文本的跨领域冷启动用户推荐网络
在大型推荐场景中,存在着众多类目(例如亚马逊平台中的书籍、影视推荐等)。用户往往只与其中部分类目有过交互,对于其他类目,由于缺少相应的历史行为记录,协同过滤方法会遭遇冷启动问题。
为了缓解冷启动问题,一类可行的方法为利用用户在其他类目上的历史交互记录进行知识迁移(跨领域推荐),比如,给喜欢武侠小说的用户推荐古装电影。同时,为了更细致地刻画用户形象,参考用户的历史评论进行辅助推荐也能起到促进作用。
近年来,跨领域推荐和基于评论的个性化推荐均取得了不俗的进展,却鲜有工作将二者结合。这类工作主要存在以下挑战:1)用户在不同类目下的关注点是不同的,且只有少量稀疏特性存在关联,导致模型较难发现此类隐式关联;2)对于在当前类目下无历史记录的冷启动用户,若直接利用其他类目下该用户的评论文本,则会不可避免地带来用户特征的抽取误差,例如,喜欢粗糙质地工艺品的用户,不一定会喜欢粗糙材质的衣物。鉴别不同类目间评论文本的语义差异,也是一个不小的挑战。
针对以上问题,本文提出了一种挖掘用户在不同类目下的评论关联,进而对冷启动用户进行推荐的深度模型,称作CATN
7、全局自适应模块:为召回模型装上第三只眼
DeepMatch在搜索、推荐和广告等系统都大量应用,是一种重要的召回方式。通常将用户 ( 搜索场景下包含 Query) 和商品通过深度模型编码成向量,线上通过向量近邻查找 top K 个商品作为召回结果。

再附下载地址:https://developer.aliyun.com/topic/download?id=724

藏经阁系列电子书

阿里云开发者社区——藏经阁系列电子书,汇聚了一线大厂的技术沉淀精华,爆款不断。
点击链接获取海量免费电子书:https://developer.aliyun.com/ebook

开发者藏经阁.jpg

相关文章
|
监控 Java Apache
阿里巴巴开源 Sentinel 限流方案搭建
Sentinel是阿里开源的一个限流方案框架具有以下特征: 丰富的应用场景:Sentinel 承接了阿里巴巴近 10 年的双十一大促流量的核心场景,例如秒杀(即突发流量控制在系统容量可以承受的范围)、消息削峰填谷、集群流量控制、实时熔断下游不可用应用等。
|
5月前
|
Kubernetes 应用服务中间件 API
应对 Nginx Ingress 退役,是时候理清这些易混淆的概念了
本文希望提供一种更简单的方式,来理解这些容易混淆的技术概念:Nginx、Ingress、Ingress Controller、Ingress API、Nginx Ingress、Higress、Gateway API。
2477 156
|
机器学习/深度学习 人工智能 API
大模型推理服务全景图
国内大模型推理需求激增,性能提升的主战场将从训练转移到推理。
3142 135
|
设计模式 运维 Cloud Native
业界首发|阿里云重磅发布云原生架构白皮书
2020 年 7 月 21 日,由阿里云 20+ 位云原生技术专家共同编撰的《云原生架构白皮书》正式对外发布。
24424 9
业界首发|阿里云重磅发布云原生架构白皮书
|
人工智能 大数据 云计算
开放下载 | 《证券行业互联网数字变革与发展白皮书》
过去几年,证券行业一直在经历变化。从证券经纪商向综合投行转变,从通道业务向资本中介业务转变,从零售交易向财富管理转变,依旧躲不开整个行业收入和利润连续三年的持续下滑。综观金融行业零售业务格局,银行、互联网金融、第三方财富管理机构各据一方,从功能、渠道上对券商形成全面挤压。未来两到三年,券商经纪与财富管理何以解除困境? 这次发布的白皮书由阿里云研究中心和恒生电子经过长达数月的实践分析调研后完成,包含了大量互联网技术以及人工智能、数据中台在金融证券行业的真实案例和应用模式,提出了未来证券行业向以数据为中心驱动运营的变化方向,还首次总结发布了券商互联网转型的四大路径。
10632 0
开放下载  | 《证券行业互联网数字变革与发展白皮书》
|
安全 虚拟化 Windows
手把手教你如何在虚拟机上安装Windows 10
手把手教你如何在虚拟机上安装Windows 10
1107 2
|
消息中间件 运维 Java
开放下载!《Rocket MQ 使用排查指南》精解100+常见问题
6个要点掌握Rocket MQ原理,5步教程快速入门Rocket MQ ,云运维工程师不可错过的匠心之作
38595 1
开放下载!《Rocket MQ 使用排查指南》精解100+常见问题
|
机器学习/深度学习 IDE 开发工具
阿里云机器学习怎么玩?这本新手入门指南揭秘了!
PAI-DSW云端IDE揭秘,动手实验室畅快玩!更有四大实践场景助你快速上手, 动手体验数据科学,成为PAI-DSW探索者!
30756 0
阿里云机器学习怎么玩?这本新手入门指南揭秘了!
|
存储 Unix Linux
限免下载!揭秘你不知道的计算机“进化论”
一书读懂计算机发展百年历史!带你趣味体会那些你不曾知道的“秘密”,了解计算机的发展起源。
24137 0
限免下载!揭秘你不知道的计算机“进化论”
|
SQL 分布式计算 Spark
国内Spark开发者的免费入门宝典!首发作者阵容高手云集!
《Apache Spark 中文实战攻略》上下两册电子书重磅来袭,本书集结国内外顶级大厂技术专家,汇集多年实战经验,带你走进全球顶级开源社区之一 Apache Spark,探秘时下最流行的开源分布式内存式大数据处理引擎。
43591 0
国内Spark开发者的免费入门宝典!首发作者阵容高手云集!