技术论文:电子商务中基于生命阶段的推荐(发表于 ACM KDD2015 )

简介: ACM SIGKDD 国际会议(简称 KDD)是数据挖掘研究领域的顶级盛会,它每年能收到上千篇来自国际知名大学和研究机构的学术论文投稿,这其中仅有一小部分优秀论文可以被接收。2015年5月18日,KDD组委会发布工业和政府相关方向论文的录用消息,阿里巴巴集团搜索事业部推荐团队投稿的论文被录用,表


ACM SIGKDD 国际会议(简称 KDD)是数据挖掘研究领域的顶级盛会,它每年能收到上千篇来自国际知名大学和研究机构的学术论文投稿,这其中仅有一小部分优秀论文可以被接收。2015年5月18日,KDD组委会发布工业和政府相关方向论文的录用消息,阿里巴巴集团搜索事业部推荐团队投稿的论文被录用,表明阿里巴巴集团在工程与学术结合方面得到了国际一流研究人员的认可。


推荐系统在现代电子商务网站中获得了非常大的成功,是数据挖掘的一项重要应用。例如,淘宝、亚马逊、沃尔玛等电商网站都提供了基于用户行为历史的推荐服务。因此,推荐系统是工业界和学术界过去10年在数据挖掘领域的研究热点。另一方面,市场销售专家和社会学家早已注意到客户人生阶段(结婚、怀孕、生孩子、搬家、装修等等)对于购买行为的重要性。这篇录用论文题为《Life-stage Prediction for Product Recommendation in E-commerce》,主要介绍基于人生阶段预测的推荐策略,利用长期历史行为数据,直接对客户的人生阶段建模和预测,并利用这种人生阶段动态的需求变化进行推荐。比如,母亲会在孩子不同的年龄段购买不同的商品。这一策略首先应用在淘宝母婴垂直领域。在离线和线上A/B分桶实验证明了有效性。


这项技术已支撑着淘宝无线和PC上众多的推荐业务(例如、手淘和PC的母婴频道,母婴无线店铺首页推荐等,在这些场景可以直接看到预测的宝宝年龄,提示根据人生阶段进行推荐,提升用户的体验)。团队包括加州大学的教授,及阿里巴巴搜索事业部的专家们。未来他们将探索和研究推荐领域更前沿的方向,比如推荐的新颖性和惊喜性,提升推荐的粘度和回访率。


本人作为一作,有幸在会议上作了口头报告。答疑阶段,有2个问题,第一是否有线上A/B test和结果;第二个问题,是关于人生阶段是否在除母婴之外其他领域有意义。针对这两个问题都根据相关slides做了相应解答。令人自豪和感动的一点是:session chair在介绍时说到,下面的paper presentation是来自阿里巴巴的工作,这也是目前世界上最有影响力的公司之一。瞬间自豪感爆棚有木有!




主要参与成员

江鹏(花名:荐轩,阿里巴巴搜索事业部 算法专家)

朱亚东(花名:朱仙,阿里巴巴搜索事业部 算法专家

张奕 (加州大学教授)

袁泉(花名:袁全,推荐团队Leader,阿里巴巴搜索事业部 资深算法专家)

相关文章
|
移动开发 搜索推荐 算法
Python基于Django的电影推荐系统和论坛项目完整源码
Python基于Django的电影推荐系统和论坛项目完整源码
Python基于Django的电影推荐系统和论坛项目完整源码
|
3月前
|
人工智能 搜索推荐 物联网
GEO优化:AI时代的流量新密码
生成式引擎优化(GEO)是针对AI驱动的搜索引擎(如ChatGPT、DeepSeek、Perplexity等)进行内容优化的策略,旨在提升品牌在AI生成回答中的可见性。 一、 GEO优化的核心框架:SEO + RAG GEO优化主要围绕两个核心环节展开,因为AI搜索通常分为“检索”和“生成”两步。  1. SEO (S…
380 2
|
10月前
|
人工智能 搜索推荐 自然语言处理
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
本文分享了大模型落地的关键:如何用阿里云 AI 搜索开放平台 打造更智能的 AI 搜索。
725 8
大模型落地的关键:如何用 RAG 打造更智能的 AI 搜索——阿里云 AI 搜索开放平台
|
运维 搜索推荐 调度
Ha3搜索引擎简介
Ha3是阿里巴巴搜索团队开发的搜索引擎平台,它为阿里集团包括淘宝、天猫在内的核心业务提供搜索服务支持。
25830 1
|
机器学习/深度学习 数据采集 数据可视化
基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究附录
k均值聚类模型多元线性回归模型随机森林模型在数据分析项目中,选择合适的模型是至关重要的。本项目中,我们采用了三种不同的模型来分析蓝莓的生长条件和产量,以确保从不同角度全面理解数据。一、K均值聚类模型K均值聚类模型是一种无监督学习方法,用于根据数据的相似性将样本分成不同的组。在这个项目中,我们使用K均值聚类模型来识别具有相似特征的蓝莓品种。通过聚类分析,我们将蓝莓分为4个类别,每个类别代表了不同的生长条件和产量特性。这种分类有助于我们理解在不同环境条件下,哪些因素对蓝莓产量有显著影响。
440 0
基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究附录
|
Python
Python报错ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
Python报错ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
2792 1
|
前端开发 JavaScript Java
技术分享:使用Spring Boot3.3与MyBatis-Plus联合实现多层次树结构的异步加载策略
在现代Web开发中,处理多层次树形结构数据是一项常见且重要的任务。这些结构广泛应用于分类管理、组织结构、权限管理等场景。为了提升用户体验和系统性能,采用异步加载策略来动态加载树形结构的各个层级变得尤为重要。本文将详细介绍如何使用Spring Boot3.3与MyBatis-Plus联合实现这一功能。
444 2
|
机器学习/深度学习 搜索推荐 算法
深度学习推荐模型-DIN
Deep Interest Network(DIN)是盖坤大神领导的阿里妈妈的精准定向检索及基础算法团队,在2017年6月提出的。 它针对电子商务领域(e-commerce industry)的CTR预估,重点在于充分利用/挖掘用户历史行为数据中的信息。
1403 1
深度学习推荐模型-DIN
|
存储 机器学习/深度学习 算法
【博士每天一篇文献-算法】连续学习算法之RWalk:Riemannian Walk for Incremental Learning Understanding
RWalk算法是一种增量学习框架,通过结合EWC++和修改版的Path Integral算法,并采用不同的采样策略存储先前任务的代表性子集,以量化和平衡遗忘和固执,实现在学习新任务的同时保留旧任务的知识。
448 3
|
安全 Unix 关系型数据库
3.10 使用tamper绕过时间戳进行注入
3.10 使用tamper绕过时间戳进行注入
428 0