技术论文:电子商务中基于生命阶段的推荐(发表于 ACM KDD2015 )

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: ACM SIGKDD 国际会议(简称 KDD)是数据挖掘研究领域的顶级盛会,它每年能收到上千篇来自国际知名大学和研究机构的学术论文投稿,这其中仅有一小部分优秀论文可以被接收。2015年5月18日,KDD组委会发布工业和政府相关方向论文的录用消息,阿里巴巴集团搜索事业部推荐团队投稿的论文被录用,表


ACM SIGKDD 国际会议(简称 KDD)是数据挖掘研究领域的顶级盛会,它每年能收到上千篇来自国际知名大学和研究机构的学术论文投稿,这其中仅有一小部分优秀论文可以被接收。2015年5月18日,KDD组委会发布工业和政府相关方向论文的录用消息,阿里巴巴集团搜索事业部推荐团队投稿的论文被录用,表明阿里巴巴集团在工程与学术结合方面得到了国际一流研究人员的认可。


推荐系统在现代电子商务网站中获得了非常大的成功,是数据挖掘的一项重要应用。例如,淘宝、亚马逊、沃尔玛等电商网站都提供了基于用户行为历史的推荐服务。因此,推荐系统是工业界和学术界过去10年在数据挖掘领域的研究热点。另一方面,市场销售专家和社会学家早已注意到客户人生阶段(结婚、怀孕、生孩子、搬家、装修等等)对于购买行为的重要性。这篇录用论文题为《Life-stage Prediction for Product Recommendation in E-commerce》,主要介绍基于人生阶段预测的推荐策略,利用长期历史行为数据,直接对客户的人生阶段建模和预测,并利用这种人生阶段动态的需求变化进行推荐。比如,母亲会在孩子不同的年龄段购买不同的商品。这一策略首先应用在淘宝母婴垂直领域。在离线和线上A/B分桶实验证明了有效性。


这项技术已支撑着淘宝无线和PC上众多的推荐业务(例如、手淘和PC的母婴频道,母婴无线店铺首页推荐等,在这些场景可以直接看到预测的宝宝年龄,提示根据人生阶段进行推荐,提升用户的体验)。团队包括加州大学的教授,及阿里巴巴搜索事业部的专家们。未来他们将探索和研究推荐领域更前沿的方向,比如推荐的新颖性和惊喜性,提升推荐的粘度和回访率。


本人作为一作,有幸在会议上作了口头报告。答疑阶段,有2个问题,第一是否有线上A/B test和结果;第二个问题,是关于人生阶段是否在除母婴之外其他领域有意义。针对这两个问题都根据相关slides做了相应解答。令人自豪和感动的一点是:session chair在介绍时说到,下面的paper presentation是来自阿里巴巴的工作,这也是目前世界上最有影响力的公司之一。瞬间自豪感爆棚有木有!




主要参与成员

江鹏(花名:荐轩,阿里巴巴搜索事业部 算法专家)

朱亚东(花名:朱仙,阿里巴巴搜索事业部 算法专家

张奕 (加州大学教授)

袁泉(花名:袁全,推荐团队Leader,阿里巴巴搜索事业部 资深算法专家)

相关文章
|
移动开发 搜索推荐 算法
Python基于Django的电影推荐系统和论坛项目完整源码
Python基于Django的电影推荐系统和论坛项目完整源码
Python基于Django的电影推荐系统和论坛项目完整源码
|
算法 搜索推荐 数据挖掘
AB实验设计
AB实验的原理、优缺点及流程
1848 0
AB实验设计
|
JSON 自然语言处理 API
对接开源大模型应用开发平台最佳实践
本文介绍如何使用OpenSearch LLM智能问答版对接大模型应用开发平台构建RAG系统。
750 8
对接开源大模型应用开发平台最佳实践
|
Python
Python报错ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
Python报错ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
2578 1
|
机器学习/深度学习 搜索推荐 算法
深度学习推荐模型-DIN
Deep Interest Network(DIN)是盖坤大神领导的阿里妈妈的精准定向检索及基础算法团队,在2017年6月提出的。 它针对电子商务领域(e-commerce industry)的CTR预估,重点在于充分利用/挖掘用户历史行为数据中的信息。
989 1
深度学习推荐模型-DIN
|
搜索推荐 测试技术
淘宝粗排问题之在粗排模型中引入交叉特征如何解决
淘宝粗排问题之在粗排模型中引入交叉特征如何解决
|
机器学习/深度学习 数据采集 数据可视化
基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究附录
k均值聚类模型多元线性回归模型随机森林模型在数据分析项目中,选择合适的模型是至关重要的。本项目中,我们采用了三种不同的模型来分析蓝莓的生长条件和产量,以确保从不同角度全面理解数据。一、K均值聚类模型K均值聚类模型是一种无监督学习方法,用于根据数据的相似性将样本分成不同的组。在这个项目中,我们使用K均值聚类模型来识别具有相似特征的蓝莓品种。通过聚类分析,我们将蓝莓分为4个类别,每个类别代表了不同的生长条件和产量特性。这种分类有助于我们理解在不同环境条件下,哪些因素对蓝莓产量有显著影响。
370 0
基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究附录
|
机器学习/深度学习 人工智能 自然语言处理
十个最适合论文写作的GPTs及其应用
十个最适合论文写作的GPTs及其应用
611 0
|
人工智能 搜索推荐 TensorFlow
阿里云PAI-DeepRec CTR 模型性能优化天池大赛——获奖队伍技术分享
超硬核解题思路快来看看吧!本期邀请“创新大师杯”全球AI极客挑战赛——PAI-DeepRec CTR模型性能优化挑战赛获奖队伍分享解题思路,共同推动实际工业实际场景中点击率预估模型的训练效率的提升。
|
运维 搜索推荐 调度
Ha3搜索引擎简介
Ha3是阿里巴巴搜索团队开发的搜索引擎平台,它为阿里集团包括淘宝、天猫在内的核心业务提供搜索服务支持。
24500 1