技术论文:电子商务中基于生命阶段的推荐(发表于 ACM KDD2015 )

简介: ACM SIGKDD 国际会议(简称 KDD)是数据挖掘研究领域的顶级盛会,它每年能收到上千篇来自国际知名大学和研究机构的学术论文投稿,这其中仅有一小部分优秀论文可以被接收。2015年5月18日,KDD组委会发布工业和政府相关方向论文的录用消息,阿里巴巴集团搜索事业部推荐团队投稿的论文被录用,表


ACM SIGKDD 国际会议(简称 KDD)是数据挖掘研究领域的顶级盛会,它每年能收到上千篇来自国际知名大学和研究机构的学术论文投稿,这其中仅有一小部分优秀论文可以被接收。2015年5月18日,KDD组委会发布工业和政府相关方向论文的录用消息,阿里巴巴集团搜索事业部推荐团队投稿的论文被录用,表明阿里巴巴集团在工程与学术结合方面得到了国际一流研究人员的认可。


推荐系统在现代电子商务网站中获得了非常大的成功,是数据挖掘的一项重要应用。例如,淘宝、亚马逊、沃尔玛等电商网站都提供了基于用户行为历史的推荐服务。因此,推荐系统是工业界和学术界过去10年在数据挖掘领域的研究热点。另一方面,市场销售专家和社会学家早已注意到客户人生阶段(结婚、怀孕、生孩子、搬家、装修等等)对于购买行为的重要性。这篇录用论文题为《Life-stage Prediction for Product Recommendation in E-commerce》,主要介绍基于人生阶段预测的推荐策略,利用长期历史行为数据,直接对客户的人生阶段建模和预测,并利用这种人生阶段动态的需求变化进行推荐。比如,母亲会在孩子不同的年龄段购买不同的商品。这一策略首先应用在淘宝母婴垂直领域。在离线和线上A/B分桶实验证明了有效性。


这项技术已支撑着淘宝无线和PC上众多的推荐业务(例如、手淘和PC的母婴频道,母婴无线店铺首页推荐等,在这些场景可以直接看到预测的宝宝年龄,提示根据人生阶段进行推荐,提升用户的体验)。团队包括加州大学的教授,及阿里巴巴搜索事业部的专家们。未来他们将探索和研究推荐领域更前沿的方向,比如推荐的新颖性和惊喜性,提升推荐的粘度和回访率。


本人作为一作,有幸在会议上作了口头报告。答疑阶段,有2个问题,第一是否有线上A/B test和结果;第二个问题,是关于人生阶段是否在除母婴之外其他领域有意义。针对这两个问题都根据相关slides做了相应解答。令人自豪和感动的一点是:session chair在介绍时说到,下面的paper presentation是来自阿里巴巴的工作,这也是目前世界上最有影响力的公司之一。瞬间自豪感爆棚有木有!




主要参与成员

江鹏(花名:荐轩,阿里巴巴搜索事业部 算法专家)

朱亚东(花名:朱仙,阿里巴巴搜索事业部 算法专家

张奕 (加州大学教授)

袁泉(花名:袁全,推荐团队Leader,阿里巴巴搜索事业部 资深算法专家)

相关文章
|
移动开发 搜索推荐 算法
Python基于Django的电影推荐系统和论坛项目完整源码
Python基于Django的电影推荐系统和论坛项目完整源码
Python基于Django的电影推荐系统和论坛项目完整源码
|
6月前
|
人工智能 搜索推荐 物联网
GEO优化:AI时代的流量新密码
生成式引擎优化(GEO)是针对AI驱动的搜索引擎(如ChatGPT、DeepSeek、Perplexity等)进行内容优化的策略,旨在提升品牌在AI生成回答中的可见性。 一、 GEO优化的核心框架:SEO + RAG GEO优化主要围绕两个核心环节展开,因为AI搜索通常分为“检索”和“生成”两步。  1. SEO (S…
709 2
|
人工智能 搜索推荐 自然语言处理
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
本文分享了大模型落地的关键:如何用阿里云 AI 搜索开放平台 打造更智能的 AI 搜索。
981 8
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
|
前端开发 JavaScript Java
技术分享:使用Spring Boot3.3与MyBatis-Plus联合实现多层次树结构的异步加载策略
在现代Web开发中,处理多层次树形结构数据是一项常见且重要的任务。这些结构广泛应用于分类管理、组织结构、权限管理等场景。为了提升用户体验和系统性能,采用异步加载策略来动态加载树形结构的各个层级变得尤为重要。本文将详细介绍如何使用Spring Boot3.3与MyBatis-Plus联合实现这一功能。
506 2
|
机器学习/深度学习 自然语言处理 搜索推荐
承上启下:基于全域漏斗分析的主搜深度统一粗排
两阶段排序(粗排-精排)一开始是因系统性能问题提出的排序框架,因此长期以来粗排的定位一直是精排的退化版本,业内的粗排的优化方向也是持续逼近精排。我们提出以全域成交的hitrate为目标的全新指标,重新审视了召回、粗排和精排的关系,指出了全新的优化方向
94551 3
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】连续学习算法之RWalk:Riemannian Walk for Incremental Learning Understanding
RWalk算法是一种增量学习框架,通过结合EWC++和修改版的Path Integral算法,并采用不同的采样策略存储先前任务的代表性子集,以量化和平衡遗忘和固执,实现在学习新任务的同时保留旧任务的知识。
514 3
|
搜索推荐 测试技术 流计算
承上启下:基于全域漏斗分析的主搜深度统一粗排
文章首先介绍了淘宝搜索的多阶段检索系统,包括召回、粗排和精排阶段。粗排模型的目标是优化商品的排序,以提高在召回集合中选择优质商品的能力。文章提到,粗排模型与精排模型的目标有所不同,粗排更注重腰部商品的排序,而精排更注重头部商品的排序。 此外,文章还探讨了模型的损失函数形式,发现原始的softmax损失函数在处理多正样本时存在问题,提出了改进的损失函数,使得模型在粗排阶段的表现更佳。最后,作者们总结了优化工作的进展,以及优化样本对齐,以实现更好的整体效果。
|
数据安全/隐私保护 弹性计算
3分钟部署 夜族崛起(VRising) 联机服务
《夜族崛起》是Stunlock Studios制作发行的一款大型多人在线的动作冒险游戏,以哥特风格的开放世界展开,玩家将扮演一名刚醒来的虚弱吸血鬼,寻找血液以恢复体力,同时躲避烈日以求生存,重建城堡和吸血鬼帝国。2024年5月8日,《夜族崛起》1.0完整版正式上线Steam平台。
3分钟部署 夜族崛起(VRising) 联机服务
|
SQL 搜索推荐 大数据
小红书如何实现高效推荐?解密背后的大数据计算平台架构
小红书作为生活分享类社区,目前有8500万用户,年同比增长为300%,大约每天有30亿条笔记在发现首页进行展示。推荐是小红书非常核心且重要的场景之一,本文主要分享在推荐业务场景中小红书的实时计算应用。
8064 0
|
算法 程序员 C++
程序员必知:单链表排序(快速排序、归并排序)
程序员必知:单链表排序(快速排序、归并排序)
464 0