开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

向量召回架构是怎样的?

向量召回架构是怎样的?

展开
收起
詹姆斯邦德00 2022-08-03 14:09:45 1061 0
1 条回答
写回答
取消 提交回答
  • 它的一个输入的数据大体是这样的,你有一些用户的 ID,然后有一些物品的 ID,然后有一些行为的数据。如下图所示,这是一个用户行为的数据表,进来之后你通过向量召回算法,最终拿到的是两个向量表。这些向量表在实际的生产中是一个 K、V 形式的。就是一个用户 ID 对应一个向量,可以在 Redis 里去暂存一下。实际的使用过程中需要把这些东西全存到 Faiss 的服务器里。Faiss 是 Facebook 的 AI 团队开源的专门针对向量检索的一个引擎。它的一个好处就是非常快,可以提供很多的向量检索的模式,甚至可以在一毫秒之内返回一个几百万级别的向量检索,它的性能非常好,常用到推荐召回的领域里。具体召回的时候,比如说我们想给一个用户推荐一个物品,我们拿着用户的 ID和它的向量进入到 Faiss 引擎里去查哪些物料向量和用户向量的欧式距离最近。比如说,把 Top10 个拿出来,作为这名用户的召回结果。这是整个的方案,会用到Redis,也会用到 Faiss 这样的一个引擎。这就是整个的向量召回的架构。

    image.png

    以上内容摘自《个性化推荐系统开发指南》电子书,点击https://developer.aliyun.com/topic/download?id=204可下载完成版

    2022-08-03 16:04:15
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关电子书

更多
MaxCompute架构升级及开放性解读 立即下载
MaxCompute Serverless 架构演进 立即下载
阿里云消息队列的 Serverless架构演进 立即下载