推荐系统之冷启动问题

简介: 冷启动问题同比于启动车辆,通常车正式开启之前需要有热车阶段,这个过程就是冷启动过程。冷启动在推荐系统也是常见的问题,大家知道类似于抖音、淘宝等工具,都会根据用户的兴趣去推荐内容,如果一个新用户进来,系统完全不清楚他的兴趣,该如何推荐呢?这就是本文要给大家介绍的内容。

前言

冷启动问题同比于启动车辆,通常车正式开启之前需要有热车阶段,这个过程就是冷启动过程。冷启动在推荐系统也是常见的问题,大家知道类似于抖音、淘宝等工具,都会根据用户的兴趣去推荐内容,如果一个新用户进来,系统完全不清楚他的兴趣,该如何推荐呢?这就是本文要给大家介绍的内容。

冷启动对于一个推荐系统是至关重要的,因为新用户最初使用APP阶段也是这名用户最可能卸载APP的时候,如果新用户进入产品不能快速给用户带来价值,是非常危险的。今天介绍的内容会围绕下面这张图展开:
image.png

首先把冷启动问题归为3个类别:

  • 系统冷启动:整个系统都是新做的,没有任何数据和经验基础
  • 推荐主体冷启动:通常指的是缺少新注册用户的历史购买或点击数据
  • 被推荐对象冷启动:通常指的是缺少商城中的新商品或者新的内容历史被点击或购买的数据

下面分别针对以上内容讲下处理方法。

系统冷启动

image.png

系统冷启动这个其实真的没太好的办法,万事开头难,系统冷启动缺少的是专家经验,建议系统在运行前务必请有经验的架构师或者产品经理参与设计,如果架构或者整个推荐策略不合理,上线后是比较难调整的。

推荐主体冷启动

当推荐主体冷启动时,往往是新用户进来之后,大方向上要从两个角度去想解决方案,一个方向是尽可能扩展用户画像,增加更多维度的信息。第二个方向在初期推荐的内容上也要有所策略。

扩充用户画像

image.png

用户画像的扩充有很多手段,常用的方法如下:

账号注册信息:注册的时候可以让用户填写年龄、性别等内容、手机号等内容,同时也可以通过LBS信息了解用户的活动区域。针对这些信息可以给用户兴趣做一个初步判断,比如年轻的都市女性,往往有较高的消费能力,在推荐策略上可以推荐高规格的一些内容

身份证信息:现在很多系统都需要实名认证,身份证号其实可以带来很多有用的信息,比如前两位是省级代码,34位是市级代码,7-14位是生日代码,第17位是性别代码(奇数代表男性、偶数代表女性)

社交账号登录:如果系统可以设计成支持淘宝、微信等账号登录,也可以通过这些系统拿到部分用户画像信息

预采集:现在很多APP,当用户初次进入都有一个兴趣爱好勾选的按钮,这个就是为了解决冷启动的一个手段,在推荐之前先通过用户标记获取用户信息

数据交换:注册的时候其实可以拿到用户的手机号码,现在有很多卖数据的公司都提供用户画像数据的交易,只要提供手机号就能获取特别全的用户数据(这个貌似是个黑产业)

推荐策略

对于这种冷启动问题推荐策略有两个方向可以选择,可以结合着来使用。

热门推荐法:反正也不清楚用户的信息,就挑平台上最热门的内容推荐,总归从概率层面上被大多受众认可的东西也有大概率被新用户认可

老虎机算法:学名叫Bandit算法,意思是假设用户前方有10个老虎机,每个都有不同的概率出钱,用户不知道这个概率,那用户该怎么选呢,就是懵!落到冷启动问题上,就是先随便推荐用户几个不同Topic的内容(一定是不同的),看看用户的反馈再决定下一步的推荐安排

被推荐对象冷启动

image.png

被推荐对象往往是平台上新增加的内容,不同于推荐主体,被推荐对象如商品、短视频、广告等,平台是有办法通过一些分析拿到内容属性的。可以通过以下两个步骤建立推荐推荐策略:

挖掘属性:先对新增内容属性进行挖掘,比如增加的是个手机,可以通过标签获取手机价格、颜色等信息,再进行下一步推荐

ICF聚类:在之前推荐系统相关的文章中已经多次介绍过协同过滤算法,本质上是先将内容分类。比如新增加的是一个美女跳舞的视频,那么再找哪些用户浏览过类似的视频,就把新增视频推荐给对应的用户,这种策略本质上是一种聚类算法。比如新增内容是个红色的手机,就找到历史上购买过红色手机的用户来推荐

目录
相关文章
|
机器学习/深度学习 存储 开发框架
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
推荐系统[八]算法实践总结V1:淘宝逛逛and阿里飞猪个性化推荐:召回算法实践总结【冷启动召回、复购召回、用户行为召回等算法实战】
|
机器学习/深度学习 边缘计算 搜索推荐
【推荐系统】如何解决冷启动问题
角度1:为了准确匹配用户的需求,解决信息超载问题,各大互联网都有个性化的推荐系统,但是在建立该系统初期,没有大量用户数据,或者系统中的商品是新添加的,那应该推荐给哪些用户的问题。
625 0
【推荐系统】如何解决冷启动问题
|
12天前
|
搜索推荐 前端开发 数据可视化
【优秀python web毕设案例】基于协同过滤算法的酒店推荐系统,django框架+bootstrap前端+echarts可视化,有后台有爬虫
本文介绍了一个基于Django框架、协同过滤算法、ECharts数据可视化以及Bootstrap前端技术的酒店推荐系统,该系统通过用户行为分析和推荐算法优化,提供个性化的酒店推荐和直观的数据展示,以提升用户体验。
|
2月前
|
搜索推荐 算法 小程序
基于Java协同过滤算法的电影推荐系统设计和实现(源码+LW+调试文档+讲解等)
基于Java协同过滤算法的电影推荐系统设计和实现(源码+LW+调试文档+讲解等)
|
2月前
|
搜索推荐 算法 小程序
基于Java协同过滤算法的图书推荐系统设计和实现(源码+LW+调试文档+讲解等)
基于Java协同过滤算法的图书推荐系统设计和实现(源码+LW+调试文档+讲解等)
|
12天前
|
搜索推荐 前端开发 数据可视化
基于Python协同过滤的旅游景点推荐系统,采用Django框架,MySQL数据存储,Bootstrap前端,echarts可视化实现
本文介绍了一个基于Python协同过滤算法的旅游景点推荐系统,该系统采用Django框架、MySQL数据库、Bootstrap前端和echarts数据可视化技术,旨在为用户提供个性化的旅游推荐服务,提升用户体验和旅游市场增长。
基于Python协同过滤的旅游景点推荐系统,采用Django框架,MySQL数据存储,Bootstrap前端,echarts可视化实现
|
12天前
|
搜索推荐 前端开发 算法
基于用户画像及协同过滤算法的音乐推荐系统,采用Django框架、bootstrap前端,MySQL数据库
本文介绍了一个基于用户画像和协同过滤算法的音乐推荐系统,使用Django框架、Bootstrap前端和MySQL数据库构建,旨在为用户提供个性化的音乐推荐服务,提高推荐准确性和用户满意度。
基于用户画像及协同过滤算法的音乐推荐系统,采用Django框架、bootstrap前端,MySQL数据库
|
2月前
|
机器学习/深度学习 搜索推荐 算法
基于深度学习神经网络协同过滤模型(NCF)的图书推荐系统
登录注册 热门图书 图书分类 图书推荐 借阅图书 购物图书 个人中心 可视化大屏 后台管理
13030 2
基于深度学习神经网络协同过滤模型(NCF)的图书推荐系统