开发者社区> thinkgamer.cn> 正文

推荐系统的一些思考

简介: 推荐系统一直以来都是电商网站必不可少的一项,在提升用户转化,增加GMV方面可谓功不可没,那么一个好的推荐算法必然会创造更大的价值,刚好最近听了一个关于推荐算法的讲座,写出来一些思考吧,算是分享一下。
+关注继续查看

<img src="http://img.blog.csdn.net/20171231111930492?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvR2FtZXJfZ3l0/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast">
<br>

打开微信扫一扫,关注微信公众号【数据与算法联盟】


转载请注明出处:http://blog.csdn.net/gamer_gyt
博主微博:http://weibo.com/234654758
Github:https://github.com/thinkgamer

推荐系统一直以来都是电商网站必不可少的一项,在提升用户转化,增加GMV方面可谓功不可没,那么一个好的推荐算法必然会创造更大的价值,刚好最近听了一个关于推荐算法的讲座,写出来一些思考吧,算是分享一下。

学术界的推荐系统

其实在大学期间也看过一些推荐的算法,还帮别人实现过关于推荐系统的毕设,但终究都是停留在协同过滤的层面,顶多是加了一些热门推荐来防止冷启动。不得不说,协同过滤打开了我对推荐系统认知的大门,当然在真实环境中这是远远不够的。

传统的推荐系统无非就是评分和排序两种方案,评分即计算出用户对item的可能评分,根据评分的高低进行排序,排序则不关心具体的评分是多少,只是为了得到一个顺序(其实这一点和推荐系统即为相似)。传统的推荐算法典型的有协同过滤和基于内容的过滤。如果你不明白什么是协同过滤算法可以参考:https://blog.csdn.net/gamer_gyt/article/details/51346159 ,如果你不知道协同过滤与基于内容的过滤的区别可参考:https://www.zhihu.com/question/19971859

大学数学术界关于推荐算法的论文都是对协同过滤的改进,而最终得到一个相对于原先的算法有很大的提升的结果,但是这些都过于理想化了,真实的环境远比实验要复杂的多,网上最有名的推荐系统数据集莫过于那个电影评分数据了,里边只有用户对电影的评分,和电影的一些信息数据。建立在这些数据上的推荐算法其实有点理想化了,他并不能模拟出真实的电商环境,数据的缺乏也是导致协同过滤算法大行其道的原因。

工业界的推荐系统

工业界的推荐系统,需要的是明确的价值走向,比如说电商网站的推荐系统是为了增加交易总额,那么在进行推荐的时候是不是应该适当过滤一些极其廉价的商品,是否应该根据用户对不同价格段的需求进行不同价格段商品的推送;如果电商的推荐系统是为了增加用户停留时间,提交CTR,那么推荐系统就不应该考虑过多别的因素,只找到用户最感兴趣的商品或者评论等,当然如何找到用户最感兴趣的也是一个问题,但是有一点不可否认的是这些如果用传统的协同过滤来做是很难满足需求的。这时候就需要开发出新的推荐架构,来适应不同的需求。

目前工业界用的最多的算法莫过于GBDT,LR,DNN等,但所有的推荐算法都会面临一个海量数据的情况,这个时候的做法便是对数据集进行数据召回,得到用户比较感兴趣的一些数据,然后再根据我们的推荐模型进行素材偏好度排序,过滤掉用户已经购买过的类别数据,继而推送给用户。

那么如何进行数据召回呢?这就需要一些基础的模型进行数据准备,比如说用户肖像,用户的价格段偏好,用户购买力水平等。根绝已有的用户数据和特征进行数据召回,适度拉取一些新的数据,保证召回结果的多样性,得到召回池数据之后,便是对模型的训练,其实模型本身难度不大,难度大的是如何选取有效的特征来作为模型的输入数据。你组合得到的有效特征越多,对于模型的训练结果就越准确。

推荐系统的多样性

如何保证推荐结果的多样性呢,首先我们要先认识到推荐的可能性,比如说电商网页首页的推荐,商品详细页面的推荐,不同年龄下的推荐,推荐的结果和被评估的指标都是不一样的。这个时候不能单一对所有情况下使用同一种算法或者特征,而是要找到能够区分出不同位置,不同年龄的推荐结果的特征,进行模型训练。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
软考新思维--2017年上半年信息系统项目管理师上午试题分析与答案(试题1-5题)
2017年上半年信息系统项目管理师上午试题分析与答案(试题1-5题) 1.信息系统是由计算机硬件、网络通讯设备、计算机软件,以及()组成的人机一体化系统。A、信息资源、信息用户和规章制度B、信息资源、规章制度C、信息用户、规章制度D、信息资源、信息用户和场地机房【软考新思维】题目中专门说:“人机一体化系统”,人是谁?当然得有信息用户啦! 选项B,排除。
1009 0
软考新思维--2017年上半年信息系统项目管理师上午试题分析与答案(试题16-20题)
2017年上半年信息系统项目管理师上午试题分析与答案(试题16-20题) 16.信息系统的安全威胁分成七类,其中不包括()A、自然事件风险和人为事件风险B、软件系统风险和软件过程风险C、项目管理风险和应用风险D、功能风险和效率风险参考答案: 16.
1051 0
推荐系统线上服务编排及架构说明
阿里巴巴技术专家傲海为大家带来推荐系统线上服务编排及架构说明的介绍。内容包括在线推理服务的架构说明和线上多目标问题两部分。
1516 0
软考新思维--2017年上半年信息系统项目管理师上午试题分析与答案(试题41-45题)
2017年上半年信息系统项目管理师上午试题分析与答案(试题41-45题) 41.以下关于项目沟通管理的叙述中,不正确的是:()A、对于大多数项目而言,沟通管理计划应在项目初期就完成B、基本的项目沟通内容信息可以从项目工作分解结构中获得C、制定合理的工作分解结构与项目沟通是否充分无关D、项目的组织结构在很大程度上影响项目的沟通需求参考答案: 41. (C) 42.沟通管理计划包括确定项目干系人的信息和沟通需求,在编制沟通计划时,()不是沟通计划编制的输入。
830 0
软考新思维--2017年上半年信息系统项目管理师上午试题分析与答案(试题30-35题)
2017年上半年信息系统项目管理师上午试题分析与答案(试题30-35题) 31.通常在()任命项目经理比较合适A、可研过程之前B、签订合同之前C、招投标之前D、开始制定项目计划前 参考答案: 31. (D) 32.现代项目管理过程中,一般会将项目的进度、成本、质量和范围作为项目管理的目标,这体现了项目管理的()特点。
790 0
软考新思维--2017年上半年信息系统项目管理师上午试题分析与答案(试题36-40题)
2017年上半年信息系统项目管理师上午试题分析与答案(试题36-40题) 下图是某项目的箭线图(时间单位:周),其关键路径是(36),工期是(37)周。 (36)A、1-4-6-8-10-11        B、1-3-9-11   C、1-4-9-11       D、1-2-5-7-11 ...
921 0
软考新思维--2017年上半年信息系统项目管理师上午试题分析与答案(试题11-15题)
2017年上半年信息系统项目管理师上午试题分析与答案(试题11-15题) 11.以下关于软件测试的描述,不正确的是:()A、为评价和改进产品质量进行的活动B、必须在编码阶段完成后才开始的活动C、是为识别产品的缺陷而进行的活动D、一般分为单元测试、集成测试、系统测试等阶段参考答案: 11. (B) 12.依据GB/T 11457-2006《信息技术 软件工程术语》,()是一种静态分析技术或评审过程,在此过程中,设计者或程序员引导开发组的成员通读已书写的设计或者代码,其他成员负责提出问题,并对有关技术风格、风格、可能的错误、是否违背开发标准等方面进行评论。
961 0
推荐系统入门之使用协同过滤实现商品推荐的实验报告-3
推荐系统入门之使用协同过滤实现商品推荐的实验报告-3
21 0
内容推荐系统
何为内容推荐系统
384 0
+关注
thinkgamer.cn
wechat 搜索【数据与算法联盟】,专注于云计算和算法,目前就职于京东
237
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载