开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):智能推荐(二)】
课程地址:https://edu.aliyun.com/course/3112108/lesson/19293
智能推荐(二)
四、数据管理和推荐算法的相关知识
1、智能推荐的关键技术-数据管理
推荐系统需要的数据可以用一句话来概况“哪个用户在什么时间点对什么内容发生了什么行为以及这个内容是什么”
数据的类型:
①物料类的数据
内容文本类的数据,比如说内容的标题、正文、作者、来源、标签、关键字、分类、发布时间等等,这里的物料并不是单指电商里面的商品;比如说把一篇文章、一个新闻都可以把它当成是物料。在电商的场景里电商的商品就是物料,这个时候数据可能还包括价格、商品属性、复购周期等等。
②用户类的数据
包括人口统计学的数据,比如用户性别、年龄、职业,这些对智能推荐都会有影响,还有一些是用户的兴趣标签;比如用户的一些兴趣爱好电影、旅游、美妆等等;包括用户的地理位置、经纬度坐标。
③静态身份数据
特定场景下的身份数据,比如有的业务场景可能需要岗位、专业、技能这种身份数据,我们需要知道的是虽然用户类的数据有很多,但并不是所有的数据都会被推荐系统需要,往往这种特定的业务场景下会用到特定的用户类数据,这个要根据业务场景进行具体分析;比如银行理财产品推荐可能会用到用户的职业、财产收入等数据,而这种数据在新闻场景下可能是不会用到的。
④用户行为数据
包含了用户对内容发生的行为,比如用户的点击、分享、点赞、收藏,对商品加入购物车也是一种行为,在商品页面的浏览或者在视频的页面浏览的时长,是否播放完毕。
对于电商系统来说用户在电商系统里进行购买这是很重要的数据,总之用户交互的过程中产生的这些行为数据非常重要。如果推荐系统目标是做到实施推荐,那推荐系统依赖用户的行为要到毫秒级,毫秒级别就要上报到推荐系统。
矩阵 |
行 |
列 |
数据类型 |
人、属性矩阵 |
用户ID |
属性 |
User Profile |
物、属性钜兴 |
物品ID |
属性 |
Item Profile |
人、人矩阵 |
用户ID |
用户ID |
关系 |
人、物矩阵 |
用户ID |
物品ID |
事件 |
这些数据可以组合成上方表格中的矩阵↑
人、属性矩阵列出来的是人具有哪些属性,列出来的就是User Profile 用户的特征;
物、属性矩阵列出来的就是物品的特性Item Profile;
人、人矩阵列出来就是找到人与人之间的关系,哪些人和哪些人是更相似的;
人、物矩阵列出来就是人和物品产生过什么样的事件。
这一步是很重要的,是能做智能推荐的数据的基础。
2、智能推荐的关键技术-推荐算法
*基于关联规则的智能推荐算法在电商领域应用较为广泛;
*关联规则的目的是挖掘数据之间的联系
关联规则的知名案例就是“购物篮分析”如下图
这是比较典型的电商数据,因为用户购买之后这些数据都会在电商系统里。通过顾客放进购物篮的商品,发现商品之间的关系,分析客户购买习惯。这是寻找频繁关系的过程,这里肉眼可见的看到鸡蛋和牛奶会经常一起购买,如果了解到了这种频繁的关系,也就意味着去市场里如果客户买牛奶,那么他也会再买鸡蛋;
如果这种可能性很大,那么零售商就可以把牛奶和鸡蛋放的近一点,这种信息就可以引导销售,刺激到用户购买这些商品。如果是在电商网站上也是类似的,当用户把牛奶放入到购物车,同样的为他展示鸡蛋的购买链接,可能下单的机会就会比较高。
这个例子反应了关联规则推荐背后最朴素的逻辑,就是分析其他的用户经常把哪些商品放在一起购买,这种关联规则的目的是去挖掘数据之间的联系。当然,关联规则不仅是用作购物篮分析,这种分析思路其实也是可以判断一种行为和另外一种行为之间的联系,通过这种行为可以去做预测,也是可以发现数据之间的联系。
五、智能推荐的相关产品
阿里云智能推荐 AIRec 产品介绍
AIRec: AI (人工智能)
Rec:Recommendation(推荐)
* 基于阿里巴巴集团领先的大数据和人工智能技术 ,结合阿里巴巴在电商、内容、新闻、视频直播和社交等多个行业领域的积累;为全球企业和开发者提供云推荐服务。
* 能够有效降低电商获客成本、用户偏好和物品关联等问题。
这个平台和淘宝、天猫推荐的底层是同根共源的,是淘宝和天猫推荐技术的对外输出。目前对于电商而言,获客成本非常高,平台是希望解决这种问题;通过这种智能推荐的产品能够帮助用户运营好流量,把每一个流量价值都充分挖掘出来,所以这个 AIRec 产品在促活、留存 、收入等整个流量的生命周期里都可以体现它的价值。
智能推荐应用案例:
* 背景:客户为图文内容分享平台,同时带有电商属性,原有首页推荐为运营人员人工编辑,有专门团队每日定时更新内容。
* 场景:使用阿里云智能推荐进行首页的内容推荐。
* 推荐效果:点击率香相较原有系统提升超过一倍。
解读:可以看到这个属于内容行业,这个行业的特点就是推荐内容比较复杂,所以它利用 AIRec 的混排和打散功能比较多,同时带有电商属性;原有首页推荐是运营工作人员每天人工编辑,有专门的团队每天定时进行内容更新。
使用阿里智能推荐进行首页内容的推荐,用这种智能推荐方式取代了原来的人工手工推荐,用了推荐之后产生的效果,经过一段时间的调优,点击率比原来系统提高一倍,这就是智能推荐系统的目的,把流量的价值充分的挖掘出来。点击率的提升肯定会带来实际上交易的提升,也就是带来了客户的价值提升。
本章小结
通过本章节的学习,我们学到了:
* 知识图谱的定义、搭建流程与应用场景
* 机器翻译的定义、常用功能与应用场景
* 智能机器人的定义、分类与应用场景
* 自动驾驶的定义、等级、软硬件系统与应用场景
* 智能搜索引擎与搜索引擎的区别以及智能搜索引擎的4项关键技术
* 智能推荐的需求背景、定义、实现流程以及智能推荐的2种关键技术