它的一个输入的数据大体是这样的,你有一些用户的 ID,然后有一些物品的 ID,然后有一些行为的数据。如下图所示,这是一个用户行为的数据表,进来之后你通过向量召回算法,最终拿到的是两个向量表。这些向量表在实际的生产中是一个 K、V 形式的。就是一个用户 ID 对应一个向量,可以在 Redis 里去暂存一下。实际的使用过程中需要把这些东西全存到 Faiss 的服务器里。Faiss 是 Facebook 的 AI 团队开源的专门针对向量检索的一个引擎。它的一个好处就是非常快,可以提供很多的向量检索的模式,甚至可以在一毫秒之内返回一个几百万级别的向量检索,它的性能非常好,常用到推荐召回的领域里。具体召回的时候,比如说我们想给一个用户推荐一个物品,我们拿着用户的 ID和它的向量进入到 Faiss 引擎里去查哪些物料向量和用户向量的欧式距离最近。比如说,把 Top10 个拿出来,作为这名用户的召回结果。这是整个的方案,会用到Redis,也会用到 Faiss 这样的一个引擎。这就是整个的向量召回的架构。
以上内容摘自《个性化推荐系统开发指南》电子书,点击https://developer.aliyun.com/topic/download?id=204可下载完成版
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。