(1)粗量化
采用多分配策略,也就是multiple assignment。取K临近索引码字对应的倒排列表。 倒排表中,也就是相应的元素。 看K取多少个,需要的结果多,那么K就可以取大一点,如果需要的结果少K就可以取小一点。
(2) 距离计算。
查询向量进去之后,通过粗量化得到码字 ID,然后取倒排列表。然后求残差,如果是非对称的,就不需要再进行量化了,直接得到距离,如果是对称的,需要经过P Q量化,得到量化编码之后再进行计算距离。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。