聊聊淘宝天猫个性化推荐技术演进史

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 个性化推荐技术直面用户,可以说是站在最前线的那个。如今,从用户打开手机淘宝客户端(简称“手淘”)或是手机天猫客户端(简称“猫客”)的那一刻起,个性化推荐技术就已经启动,为你我带来一场个性化的购物之旅。本文将细数个性化推荐的一路风雨,讲讲个性化推荐技术的演进史。

引言:个性化推荐技术直面用户,可以说是站在最前线的那个。如今,从用户打开手机淘宝客户端(简称“手淘”)或是手机天猫客户端(简称“猫客”)的那一刻起,个性化推荐技术就已经启动,为你我带来一场个性化的购物之旅。本文将细数个性化推荐的一路风雨,讲讲个性化推荐技术的演进史。
本文选自[《尽在双11——阿里巴巴技术演进与超越》。

1、个性化推荐All-in无线

  无线个性化推荐起步于2013年10月。现在往回看,当时的阿里很好地把握住了移动端快速发展的浪潮,以集团All-in无线的形式吹响了移动端战斗的号角。个性化推荐团队也是从All-in无线这一事件中孵化的。我们从零开始搭建了个性化推荐算法体系及个性化算法平台TPP。TPP这一个性化算法平台对个性化推荐团队的成长起到了至关重要的作用。基于TPP,个性化算法团队成员们验证算法的速度得到了极大的提高,优化算法的速度从而也得到了极大的提高。仅仅花了不到两个月的时间,个性化推荐的第一版算法就在“有好货” 中初露锋芒:结合基于主动学习的选品算法平台TSP,个性化推荐团队一举打造了“有好货”针对高端人群的优质导购体验。
  2014年,随着个性化推荐算法团队对业务问题有了更好理解,以及技术研发的深入,我们逐步开发并上线了排序引擎RTP、标签探索算法PairTag及在线学习引擎Olive(如下图所示)等多项核心技术。个性化推荐算法也因此被快速地应用到“发现好店”、“爱逛街”、“猜你喜欢”及购物链路等手淘的各个主要场景中。其中,手淘底部的“猜你喜欢”商品瀑布流推荐是亿万用户每天登录手淘后必逛的场景,为人们搜寻和发掘自己喜好的商品提供了便捷的渠道。“猜你喜欢”也一举成为中国电商中最大的推荐产品。
【图1】
                           Olive流程图

  正是在All-in无线后的这一年,个性化推荐开始在阿里逐步成长起来。

2、 个性化推荐初逢双11

  2015年,个性化推荐第一次在双11中大放异彩。还记得当年9月中旬,我们正在维也纳参加推荐系统最大的会议RecSys。逍遥子突然来电,告知在2015年双11上要全面开启个性化推荐,随行的同事们都很兴奋,但我们又不得不面临缺乏双11实战经验的实际问题。当然,机会和风险往往是并存的。面对挑战,我们很快开始规划进程和分工。回到杭州之后,团队全员进入备战状态,我们的努力在双11当天得到了回报。2015年11月12日凌晨,推荐算法团队、手淘及天猫的众多小伙伴们并不觉得疲乏,大家的脸上都闪烁着喜悦。个性化推荐算法在双11大放光芒,一个又一个令人瞠目的数字足以为证。个性化推荐的第一战场“双11主会场”更是自双11开展多年以来首次达到了个位数的跳失率,其引导人数和人均引导页面数都是前一年的2~3倍。不得不说,这些令人振奋的结果都要归功于之前两年中个性化推荐在无线端的落地。
  2015年双11主会场个性化算法(即“天坑一号”,如下图)包括三个层次:楼层顺序个性化、楼层内坑位个性化、坑位素材个性化。这三个层次自顶向下,在用户体验上形成一套完整的方案。其中:

  • 楼层顺序个性化使得女神看到的楼层顺序可能是女装、美妆、天猫国际等,欧巴看到的楼层顺序可能是男装、旅行、数码等。
  • 楼层内坑位内容个性化,使得在同一个楼层内,不同用户看到的商品或店铺不同,比如同样都是美食控,喜欢辣味的用户可能看见麻辣牛肉干,喜欢甜味的用户可能看见巧克力。
  • 坑位内容素材个性化,使得同一个楼层的同一个坑位,即便算法预测两个用户都需要巧克力,但一个喜欢费列罗而另一个喜欢德芙,也会在入口图上展示不同的品牌。
               【图2】

                       “天坑一号”个性化主会场示意图

这三层个性化中涉及多策略推荐算法、排序学习、合图等多项技术。整个项目的进展用六个字来总结就是“时间紧任务重”。在多个团队的辛勤工作及紧密协作下,我们第一次全方位地将自All-in以来所积累的个性化推荐技术用于如此复杂的场景之中。
  个性化推荐在“双11主会场”取得成功的因素有很多。其中,最值得称道的莫过于“首图个性化”。在指甲壳大小的空间上,我们对产品创意素材和文字进行精雕细琢和个性化投放。这一改变极大地提升了用户活跃度,并催生了2015年双11主会场的个性化项目。该项目的成功上线成倍地降低了会场跳失率。更重要的是,个性化推荐为用户带来了全新的无线端购物体验,并且为阿里在电商领域的茁壮成长带来了显著的助力作用。个性化推荐算法团队因此荣获2015年CEO特别贡献奖。下面引用阿里巴巴CEO逍遥子嘉奖信里的一段话:“这次双11的一大亮点是,我们基于大数据的无线产品和技术的创新,使得整个运营效率有了大幅度提升。淘系的活跃用户得到了充分的引导和互动,得到了大量个性化的展示和推荐,事实证明了大数据的巨大威力。我们用大数据赋能了双11,赋能了我们自己的运营能力。”
正是在2015年双11之后,个性化推荐的故事开始为人们津津乐道。

3、 个性化推荐再战双11

  2015年双11之后,个性化推荐团队乘风起航,继续发力。正是这一年的持续发展,使得个性化推荐在2016年双11中更进一步,遍及无线端的各个场景。包括主会场在内的几乎全部活动会场、产品都实现了个性化算法投放。个性化推荐团队的代表作“海神”以及“鲁班”(下图为鲁班批量生产的创意Banner)都是首次在双11中亮相。
            【图3】
                       鲁班批量生产的创意Banner
                       
  在2016年双11中,面对更为复杂的个性化需求,乐田及工程师们将全面升级后的个性化推荐完美地展现在双11主会场中。虽然2016年的双11主会场与2015年的“天坑一号”主会场极其相似,但这一次个性化推荐产品做得更为精细了。其中,GBDT+FTRL、Wide & Deep Learning和AdaptiveLearning这三项最前沿的机器学习技术被应用到了主会场的三层结构中,极大地提升了在线模型的效果及实时预测的效率。
  除了常规的个性化推荐之外,我们在2016年双11开始尝试融合商家流量分配的个性化推荐。逍遥子在2015年双11总结中提到:“我们还要更上一层楼,利用大数据赋能给所有的商家,帮助他们运营好消费者,这样才能让我们在大数据时代践行‘让天下没有难做的生意’的使命。”随着个性化场景的不断升级,商家很多时候都对流量的波动束手无策。对那些有运营能力的商家来说,我们希望其通过更多优质的商品和优秀的服务换来更多的流量或销量上的部分确定性。因为推荐各场景大小不一、定位差异大,有导购类场景、有成交类场景等,我们需要根据场景本身的特性来进行流量智能调控。因此,商家赋能个性化推荐系统 — Matrix应运而生。Matrix系统主要用于调节用户体验、卖家流量诉求和投资回报率、电商平台健康度等方面的效用,平衡场景的短期收益和长期收益。在2016年双11中,Matrix在部分场景的上线为今后的卖家赋能积累了宝贵的经验。
               【图4】
                      赋能商家的Matrix系统流程图

4、 个性化推荐的智能未来

  个性化推荐从无到有,直到演进成为CEO逍遥子口中的“电商基础设施”,这一切来得极为不易。面对更具挑战的未来,个性化推荐可以做得更好、更智能,而基于全局信息的个性化推荐将会是达成这一目标的重要途径。
众所周知,个性化推荐涉及多种不同层次、不同粒度的子任务。从推荐内容上来说,个性化推荐分为商品推荐、店铺推荐、品牌推荐、评论推荐等;从推荐目标上来说,个性化推荐分为点击率预测、转化率预测、成交量预测等。虽然我们当前设计的个性化推荐算法在TPP上实现了流程一体化,但我们对每个推荐场景面临的子问题却是单独建模的。如果能从全局的角度分析用户的喜好,个性化推荐必然能够更上一层楼。
  2016年,我们已经通过深度强化学习(Deep Reinforcement Learning)技术对全局信息共享下基于多任务学习  (Multi-task Learning)的个性化推荐进行了初步探索。从数据流通链路来看(比如下图所示的手淘场景数据流通图),我们可以很自然地将全链路多场景的推荐任务理解为推荐系统面向用户的连续决策过程。随着用户对不同推荐场景的持续浏览和交互,推荐系统对于用户实时需求和意图的理解会越来越清晰,因此也可以更准确地为用户推荐更为合适的内容。深度强化学习已经在人工智能领域掀起了新的浪潮,这一技术必将成为个性化推荐智能化的最强武器。
              图片描述
                       手淘场景数据流通图

5、 总结

  个性化推荐所取得的成就是一个“意料之外却情理之中”的结果。仅仅经历了短短几年的时间,淘宝和天猫就从以人工运营为主分配流量和资源位的方式成功转变为以大数据和人工智能为导向的新方式。与此同时,我们初步建立了人工经验与算法投放协同工作的机制。自2013年年底All-in无线以来的沉淀和积累终于逐步转化成了果实。经过不断地积累和打磨,个性化推荐技术变得越发成熟和犀利,相信个性化推荐的未来会更好。
  本文选自《尽在双11——阿里巴巴技术演进与超越》,点此链接可在博文视点官网查看此书。
                     图片描述
  想及时获得更多精彩文章,可在微信中搜索“博文视点”或者扫描下方二维码并关注。
                        图片描述

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
小程序 前端开发 JavaScript
【电商新机遇】支付宝小程序如何助你打造爆款电商解决方案?揭秘背后的技术奥秘!
【8月更文挑战第27天】本文详细介绍如何利用支付宝小程序构建电商应用,覆盖从项目初始化、页面设计、功能开发到数据分析的全流程。首先,需注册开发者账号并安装相关工具;随后创建项目,并按示例配置基本页面结构;接着设计商品列表等界面布局;再实现商品展示等功能;最后运用支付宝提供的工具进行数据分析,以优化用户体验及营销策略。跟随本教程,您将能打造出一款完整的电商小程序。
94 1
|
6月前
|
运维 API 数据安全/隐私保护
京东JDAPI:电商行业的得力助手
在当今电商行业中,数据的获取与利用显得尤为重要。作为中国领先的电商平台,京东提供了丰富的API接口,其中JD商品详情API是关键之一,它允许第三方开发者获取京东平台上的商品详情信息。本文将深入探讨京东JD商品详情API在电商行业中的重要性,以及如何通过该API实现实时数据获取。
|
人工智能
2023 淘宝天猫开放生态AIGC挑战赛
2023 淘宝天猫开放生态AIGC挑战赛
|
移动开发 双11 Android开发
|
缓存 监控 安全
天猫淘宝卡券包演进史
卡券包整体分为PC端以及无线端两大部分,最开始的卡券包是PC版,随着PC向无线化转型的大潮,无线端卡券包也同步产生。
296 0
天猫淘宝卡券包演进史
|
机器学习/深度学习 人工智能 自然语言处理
淘宝千人千面背后的秘密:搜索推荐广告三位一体的在线服务体系AI·OS
揭晓三位一体的在线服务体系AI·OS,及其技术架构演进,技术概况,云原生产品与实践。
淘宝千人千面背后的秘密:搜索推荐广告三位一体的在线服务体系AI·OS
|
机器学习/深度学习 编解码 达摩院
淘宝直播火爆的背后,阿里做了什么?
2020天猫双11的直播间里,平台必须在1秒内将主播声音、画面和商品信息同步给分布范围极广的百万级消费者,确保后者获得一致的、实时的、高水平的音视频体验,以及商品交易(尤其是秒杀)的可信度。为了进一步优化消费者体验,降低延时,阿里巴巴非常重视在音视频技术领域的投入。本文从最新的国际视频标准VVC(Versatile Video Coding,多功能影像编码)讲起,分享视频直播行业的全景与阿里的创新,以及达摩院和淘宝团队共同开发的VVC编解码器相关工作。
淘宝直播火爆的背后,阿里做了什么?
|
算法 vr&ar 异构计算
火爆专场 干货来袭 | 淘宝端智能演进和思考
过去一年中,出现很多新的技术,例如:移动 AI ,这些新技术会给开发带来什么新变化?阿里巴巴资深技术专家——吕行 将为大家带来「淘宝端智能演进和思考」。
7251 0
火爆专场 干货来袭 | 淘宝端智能演进和思考
|
机器学习/深度学习 搜索推荐 算法
优酷视频基于用户兴趣个性化推荐的挑战和实践
本文将介绍一下优酷个性化搜索推荐的服务,优酷在视频个性化搜索推荐里用户兴趣个性化表达碰到的挑战和问题,当前工业界常用的方法,以及我们针对这些问题的尝试。
4083 0
|
前端开发 Java 程序员
天猫高级技术专家郑恩阳:技术驱动下的电商互动营销
首届阿里巴巴在线技术峰会(Alibaba Online Technology Summit),将于7月19日-21日 20:00-21:30 在线举办。本次峰会邀请到阿里集团9位技术大V,分享电商架构、安全、数据处理、数据库、多应用部署、互动技术、Docker持续交付与微服务等一线实战经验。
7278 0