首先我把整个推荐业务做了一个简图,如下图所示。假设我们有一个新闻平台,用户 A 进来,它有一个 ID。这个平台有成千上万的新闻,我们把它叫 item。每个item 有一个 ID,比如说 1、2、3 这样排列下去。我们现在要把 10 万个 item 中筛选出用户 A 喜欢的新闻。我们看一下要做这件事,在底层的业务架构要有哪些模块。在一个经典的排序推荐召回系统里,它会有两个模块。第一个叫召回,第二个叫排序。召回模块把这 10 万个新闻做一个初筛,选出 A 可能喜欢的,比如说 500 个 item 先放到这里,我们只知道 A 大致会喜欢这 500 个 item,并不知道这 500 个 item 哪个是 A 最喜欢的,哪个是他第二喜欢的。接下来是排序模块,对这 500 个 item 做一个排序,按照喜爱的顺序去制定最终投放给 A 的 item 的列表。所以在整个的推荐业务中,召回模块更多的是一个初筛,确定一个大体的轮廓和范围。这样的话可以加速排序模块对于每个商品的属性排序,用户得到推荐反馈的效率会更高。一个专业的推荐系统需要在几十毫秒内,即用户一进来就可以给他推荐反馈。对 Feed 流的内容,用户在网上刷一下屏幕,可能有几十毫秒,然后我们马上要把新推荐的 item 又展示出来。这是整个推荐业务的逻辑。
以上内容摘自《个性化推荐系统开发指南》电子书,点击https://developer.aliyun.com/topic/download?id=204可下载完成版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。