开发者学堂课程【场景实践 - 搭建个性化推荐引擎系统:推荐系统概念和应用场景】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/522/detail/7051
推荐系统概念和应用场景
内容介绍:
一、课程目标
二、目录
三、推荐系统产生的背景
四、什么是推荐系统
五、什么是个性化推荐系统
六、为什么需要推荐系统
七、怎样才算一个好的推荐系统
八、应用广泛的推荐系统
一、课程目标
本次主要讲解如何使用阿里云的推荐引擎产品搭建个性化推荐系统
1.了解推荐系统概念和应用场景
2.了解推荐引擎的算法原理
3.了解推荐引擎产品 RecEng
4.能够使用 RecEng 搭建推荐系统
通过本次的学习掌握一些概念性的理论,例如什么是推荐系统以及它使用的相关场景。其次,了解推荐引擎的相关算法,了解阿里云推荐引擎 receng,通过本次的学习掌握 receng 的相关原理以及使用方法。最终通过本次课程的学习,掌握了相关的知识以后在后续的工作学习中,可以独立的通过阿里云的推荐引擎 Receng 搭建相关的推荐系统。
二、目录
1.推荐系统概念和应用场景
推荐系统产生的背景、推荐系统的概念以及推荐系统存在的必要性(为什么需要推荐系统)。
2.推荐引擎的算法原理
常用的四种推荐算法,基于人口统计学的推荐、基于内容的推荐、基于用户的协同过滤和基于物品的协同过滤。
3.推荐引擎产品 RecEng 介绍
阿里云的推荐产品 Rec eng 具体是什么,它的用途、特点以及阿里云推荐产品的对应模型,也就是具体要获取什么样的数据信息才能做相关的推荐操作。
4.实践:搭建电商推荐系统
如何在一个图书电商平台中使用阿里云的推荐产品来搭建推荐系统。
三、推荐系统产生的背景
1.信息过载问题
是在信息时代信息过于丰富的现象,人类接收的信息超过了个人所能接受处理和有效利用的范围,导致了无从适从的问题,通俗一点的场景例如某人区大型商场购买东西,商品种类比较多而且同一类产品的品牌和型号特别多,挑选起来比较困难,这就算一种信息过载的情况,这说的是线下实体店存在的场景。
互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息过载问题。
2.长尾问题
长尾理论认为,由于成本和效率的因素,当商品储存流通展示的场地和渠道足够宽广,商品生产成本急剧下降以至于个人都可以进行生产,并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品,只要有卖,都会有人买。这些需求和销量不高的产品所占据的共同市场份额,可以和主流产品的市场份额相比,甚至更大。关键是建立小众商品和关注他们的人群的匹配。
简单地说,所谓长尾理论指的是商品的未来不在于传统需求曲线,代表畅销商品的投货,也就是图中的红色body这部分,而代表冷门商品即经常被人遗忘的长尾,也就是图中蓝色这一部分。
举例来说,一些大型书店通常能够摆放十万本书,但是亚马逊网站的图书销售额有1/4来自排名十万以后的数据,这些冷门书籍的销售比例正在高速成长,预计未来可占整个书市的一半,简而言之,就是图中的蓝色长尾,涉及到的冷门商品慢慢的会涵盖几乎所有的需求,这时一个新的商业模式就产生了就是如何把小众商品和关注这些的人群相匹配。
3.问题的解决
决信息过载问题和长尾问题一个非常有潜力的办法是推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。
和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。
这张图是电商平台的推荐模块,里面包含了用户的查看信息,以及系统的推荐信息。一个好的推荐系统不仅能为用户提供个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。
四、什么是推荐系统
利用电子商务网站向客户提供商品信息和建议,帮助用户决定购买什么产品模拟销售人员帮助客户完成购买过程。
推荐系统现已广泛应用于很多领域,其中最典型并具有良好的发展和应用前景的领域就是电子商务领域。同时学术界对推荐系统的研究热度一直很高, 逐步形成了一门独立的学科。推荐系统领域有一些著名的团队和人员,例如密歇根大学卡耐基梅隆大学,微软等等,都有自己的推荐系统团队。
推荐系统有3个重要的模块:用户建模模块、推荐对象建模模块、推荐算法模块。
通用的推荐系统模型流程如图。推荐系统把用户模型中兴趣需求信息和推荐对象,模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。
用户建模模块就是能捕获到的用户商品以及用户行为的信息数据,推荐对象模块就是推荐算法所运行时必须提供的模型数据,推荐算法模块就是包含选择的具体的推荐算法、通用的推荐系统模型,如上图所示,通信需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。咱点说就是从系统中捕获用户的个人偏好信息,比如说笔试纺记录,然后将这些信息加工到用户建模模型中,最终用户建模模型需要与推荐算法的键盘模型相匹配,然后通过推荐算法最终的推荐结果返回给客户。
五、什么是个性化推荐系统
个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,用户有可能花大量时间才能找到自己想买的商品。这种浏览大量无关信息和产品过程,无疑会淹没在信息过载问题中,消费者在这种情况下会不断的流失,为了解决这些问题个性化推荐系统应运而生。
个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
六、为什么需要推荐系统
推荐系统产生的背景与推荐系统的相关概念基本上可以想到推荐系统存在的必要性。对于用户来说在信息爆炸的时代,作为一个信息消费者,每天面对海量的资讯商品,音乐等等,如何快速找到自己感兴趣的内容,是一件比较耗费时间和精力的事情。
而对于商家而言,或者对一个企业来说,作为一个信息的生产者,如何让自己生产的信息脱颖而出,受到广大用户关注也是一件非常困难的事
对交易平台来说,交易平台如何让商家的商品和消费者相互匹配,提升商品的转化和体验率,也是势必要考虑的问题,提高效率、提高成交量都是交易平台的最终目的,平台拥有海量的资源,但是可能只有一小部分使用量比较大,大部分都会石沉大海隐藏起来。所以说在当前各种产品同质化的今天,如何讨好并流入客户,挖掘数据中存在的价值,快速准确找到商品对应的用户群,并向他推送数据,对企业也是一种极大的挑战,所以越来越多的实验证明推荐系统是解决上述问题的有效工具。
七、怎样才算一个好的推荐系统
如何才算是一个好的推荐系统,好的推荐系统会具有哪些相关特征。比如说用户满意度,首先这是一个相对主观的指标,一般是通过用户调研获取,而用户基本上也不确定自己想要什么,最多看一下表面上的感受,参考价值其实并不大。
其次,对推荐系统好坏的往往是项目的 PM,其满意度的概念很容易被同化成 PM 的满意度或者老板的满意度,所以在实际情况下,会衡量准确度的客观指标来参考,比如,通过点击率的统计来看用户推出内容的满意程度。
准确度是衡量推荐系统好坏最重要的指标之一,并且可以通过离线数据进行运算指导,推荐系统优化,简单解释就是系统的猜测是否准确。比如说信用参数,用户喜欢豪华轿车,那就给用户推送一整页高端轿车的内容,能让用户一张一张的翻阅,而这个准确度应该就是极高的。
覆盖率,推荐系统的维新能力,既然推荐是为了给长尾信息更多的曝光,那么推出内容太低也会使推荐的效果大打折扣,这点是新闻推荐 app 做得很不错,展现给大多数自媒体人的后台数据都很好看。
多样性衡量推荐系统的好坏,另一个最重要的指标也就是推荐系统到最后最容易出现的过度熟脸,使用准确度的例子进行说明,比如说系统知道用户喜欢轿车,于是系统每天都在推送轿车信息,这样用户肯定就不满意,除了轿车用户肯定还有别的爱好,就比如说用户喜欢手表,所以说系统应该强化应用,比如说在系统里面豪华轿车的内容权重是1而高端手表的内容权重就可以变成5,让高端手表类的内容有机会出现。或者人为卡死死一些其他内容出现这样对推荐多样性和新颖度都会有不错的改善,不能改善新的用户之前没有接触过的内容。
精喜度是推出和之前内容没有任何关系,但是用户很满意的内容。这是一个很主观的指标,比较难衡量。
还有一些跟场景比较相关的指标,这里就不再赘述了,比如信任度有实质性、建设性,在不同的应用场合,比如说社交可能会关注信任度,新闻会关注实时性。以上指标并不是越高越好,指标都会存在内在联系,比如说多样性和新颖性高了准确度就会下降,所以指标的最优搭配才是衡量一个好系统的最高标准。
八、应用广泛的推荐系统
电子商务
影视网站
网络电台
社交网络
个性化阅读
位置服务
个性化邮件
个性化广告
电子商务网站可以给用户推荐商品,影视网站可以给用户推荐影片,网络电视可以给用户推荐节目,社交网络可以给用户推荐一些兴趣相投的朋友,个性化广告可以给用户推荐其他感兴趣的广告等等。